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内 容 提 要 
本 书 采用 大 量 图 片 ， 通 过 详细 的 分 步 讲解 ， 以 直观 、 易 懂 的 方式 展现 了 7 个 数据 结构 和 26 个 基 


础 算法 的 基本 原理 。 第 1 章 介绍 了 链表 、 数 组 、 栈 等 7 个 数据 结构 ， 从 第 2 章 到 第 7 章 ， 分 别 介绍 了 
和 排序 、 查 找 、 图 论 、 安 全 、 聚 类 等 相关 的 26 个 基础 算法 ， 内 容 涉 及 冒 泡 排序 、 二 分 查找 、 广 度 优 
先 搜索 、 哈 希 函 数 、 迪 菲 - 赫 尔 曼 密 钥 交换 、k-means 算法 等 

本 书 没有 枯燥 的 理论 和 复杂 的 公式 ， 而 是 通过 大 量 的 步骤 图 帮助 读者 加 深 对 数据 结构 原理 和 算法 
执行 过 程 的 理解 ， 便 于 学 习 和 记忆 。 将 本 书 作为 算法 入 门 的 第 一 步 ， 是 非常 不 错 的 选择 。 
本 书 适 合 所 有 对 算法 感 兴趣 ， 想 要 从 零 开始 学 习 算法 的 读者 阅读 。 
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本 书 主页 


http://www.ituring.com.cn/book/2464 





阅读 本 书后 ， 您 可 通过 以 上 网 址 将 您 的 感想 、 


意见 或 问题 写 下 


来 。 


男 外 ， 点 击 页 面 右 侧 的 “提交 /查看 勘误 ”可 以 提交 或 查看 本 书 勘误 。 
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※ 本 书 在 出 版 之 际 已 力求 内 容 的 准确 性 ， 但 是 对 于 应 用 本 
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本 书 以 iOS 和 Android 平台 上 的 应 用 程序 “算法 动画 图 解 ”为 基础 ， 以 图 配 文 ， 详 细 讲解 
了 各 种 算法 和 数据 结构 的 基本 原理 。 如 果 本 书 能 够 帮助 大 家 理解 基本 算法 的 操作 和 特征 ， 那 么 
我 将 感到 十 分 荣幸 。 

使 用 不 同 的 算法 解决 同一 个 问题 时 ， 就 算得 到 的 结果 是 一 样 的 ， 算 法 之 间 的 性 质 也 有 很 大 
的 差异 。 比 如 ， 某 个 算法 的 运行 时 间 很 短 ， 但 需要 占用 大 量 内 存 ; 而 另 一 个 算法 运行 时 间 较 长 ， 
但 内 存 资源 占用 较 少 。 学 习 各 种 算法 可 以 使 我 们 在 编程 时 有 更 多 的 选择 。 成 为 优秀 程序 员 的 必 
要 条 件 之 一 ， 就 是 可 以 根据 应 用 场景 选择 最 合适 的 算法 。 

如 果 您 对 算法 有 兴趣 ， 还 可 以 挑战 一 下 “算法 理论 ”这 门 学 科 ， 试 着 去 发 现 更 高 效 的 算法 ， 
或 者 研究 目前 用 算法 还 无 法 解决 的 问题 。 


















































石田 保 辉 





算法 是 解决 问题 的 计算 步 怠 ， 用 于 编写 程序 之 前 。 即 使 是 解决 同样 的 问题 ， 高 效 算法 和 低 
效 算法 所 花费 的 时 间 也 过 然 不 同 。 另 外 ， 要 想 执行 高 效 的 算法 ， 还 需要 使 用 合适 的 数据 结构 。 











本 书 的 目的 就 是 让 初学 者 也 能 轻松 地 理解 算法 和 数据 结构 。 

本 书 以 iOS 和 Android 平台 上 的 应 用 程序 “算法 动画 图 解 ”为 基础 。 该 应 用 以 动画 的 形式 
展示 了 算法 的 流程 ， 而 本 书 则 采用 了 大 量 的 图 片 来 分 步 讲 解 ， 尽 量 保留 了 原 应 用 易 懂 的 优点 。 
为 了 配合 出 版 ， 本 书 还 添加 了 “什么 是 算法 ”“ 算 法 的 运行 时 间 ”“ 图 的 基础 知识 ”等 应 用 中 没 
有 的 章节 ， 相 信 会 让 读者 对 算法 的 理解 更 加 深刻 。 

读 完 本 书 ,， 不 过 是 站 在 了 算法 世界 的 入 口 ， 这 个 世界 还 有 很 多 领域 等 待人 们 去 探索 。 如 果 
您 由 此 对 算法 产生 了 兴趣 ， 请 务必 继续 深入 学 习 。 























本 书 中 大 量 使 用 了 应 用 程序 “算法 动画 图 解 ” 中 的 图 片 ， 在 使 用 之 前 ， 我 们 得 到 了 图 片 制 
作者 光 森 裕 树 先生 的 许可 。 此 外 ， 从 选 题 策划 、 内 容 编 辑 到 出 版 进度 管理 ， 翔 瀛 社 的 秦 和 宏 先 
生 在 本 书 的 整个 出 版 流程 中 都 付出 了 颇 多 心血 。 在 此 对 二 位 表示 由 囊 的 感谢 。 
石田 保 辉 言 崎 修一 



































关于 应 用 程序 “算法 动画 图 解 ” 的 说 明 


本 书 根据 i0OS 和 Android 平台 上 的 应 用 程序 “算法 动画 图 解 ” 编 写 而 成 ， 为 配合 图 书 出 
版 ， 对 内 容 进 行 了 补充 和 修正 ， 专 门 添加 了 基础 理论 方面 的 内 容 。 
对 于 本 书 中 出 现 的 各 个 算法 ， 应 用 内 都 采用 动画 交互 的 方式 进行 了 讲解 ， 部 分 算法 还 可 以 


通过 改变 设置 尝试 不 同 的 模式 。 将 应 用 和 本 书 


读者 通过 下 面 的 步骤 下 载 该 应 用 并 加 以 灵活 运用 。 





* 目 冒 泡 排序 
“ 妈 测试 
“ 则 选择 性 排序 
“只 测试 
“ 导 插入 排序 
“人 测试 
* 司 堆 排 序 
"点 测试 
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结合 使 用 ， 可 以 加 深 对 相关 知识 的 理解 。 请 各 位 


红 人 全 


贝尔 曼 - 福 特 算法 


全 全 生生 生生 二 让 村 国 央 昌 条 许仙 


本 ED 








iPhone /iPad 用 户 
Q@ 打开 App Store 


@) 点击 “搜索 ”， 输 入 “算法 动画 图 解 ” 


加 点 击 “ 获 取 ” 











> Android 用 户 
Q@ 打开 Google Play 


@) 打开 页 面 上 的 “搜索 ”项 ,输入 “算法 动 


画图 解 ” 进 行 搜索 


@ 进入 应 用 “Algorithms: Explained and Animated” 











为 免费 下 载 ， 可 以 免费 试 














明 部 分 算法 ， 但 解锁 所 有 项 





的 页 面 ， 点 击 “安装 ” 


目 需要 在 应 用 内 购买 。 
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什么 是 算法 


1 算法 与 程序 的 区 别 








算法 就 是 计算 或 者 解决 问题 的 步 又。 我 们 可 以 把 它 想象 成 食谱 。 要 想 做 出 特定 的 料理 ， 就 
要 遵循 食谱 上 的 步骤 ; 同 理 ， 要 想 用 计算 机 解决 特定 的 问题 ， 就 要 遵循 算法 。 这 里 所 说 的 特定 
问题 多 种 多 样 ， 比 如 “将 随意 排列 的 数字 按 从 小 到 大 的 顺序 重新 排 刚 "”“ 寻 找 出 发 点 到 目的 地 的 

















最 短路 径 ”， 等 等 。 


食谱 和 算法 之 间 最 大 的 区 别 就 在 于 算法 是 严密 的 。 食 谱 上 经 常会 有 描述 得 比较 模糊 的 部 分 ， 














而 算法 的 步骤 都 是 用 数学 方式 来 描述 的 ， 所 以 十 分 明确 。 





算法 和 程序 有 些 相似 ， 区 别 在 于 程序 是 以 计算 机 能 够 理解 的 编程 语言 编写 而 成 的 ， 可 以 在 
计算 机 上 和 运行， 而 算法 是 以 人 类 能 够 理解 的 方式 描述 的 ， 用 于 编写 程序 之 前 。 不 过 ， 在 这 个 过 





























程 中 到 哪里 为 止 是 算法 、 从 哪里 开始 是 程序 ， 并 没有 明确 的 界限 。 














就 算 使 用 同一 个 算法 ,编程 语言 不 同 ， 写 出 来 的 程序 也 不 同 ; 即便 使 用 相同 的 
写 程序 的 人 人 不同， 那么 写 出 来 的 程序 也 是 不 同 的 。 





1 排列 整数 的 算法 : 排序 


> 查找 最 小 的 数字 并 交换 : 选择 排序 
来 看 一 个 具体 的 算法 示例 吧 。 这 是 一 个 以 随意 
排列 的 整数 为 输入 ， 把 它们 按 从 小 到 大 的 顺序 重新 排 




















i 程 语言 ， 


列 的 问题 。 这 类 排序 问题 我 们 将 在 第 2 章 详细 讲解 。 
只 解决 这 一 个 问题 很 简单 ， 但 是 算法 是 可 以 区 / 回 








应 对 任意 输入 的 计算 步 又 ， 所 以 必须 采用 通用 的 
描述 。 昌 然 在 这 个 示例 中 输入 的 整数 个 数 n 为 8， 


























然而 不 管 n 多 大 ,算法 都 必须 将 问题 解决 。 
那么 ， 你 首先 想到 的 方法 ， 是 不 是 先 从 输入 的 加 日 
数字 中 找 出 最 小 的 数字 ， 再 将 它 和 最 左边 的 数字 交 














换 位 置 呢 ? 在 这 个 示例 中 就 是 找到 最 小 数字 1， 然 后 将 它 和 最 左边 的 7 交换 位 置 。 


.| 
4 
oonnene 


这 之 后 1 的 位 置 便 固 定 下 来 ， 不 再 移动 。 接 下 来 ， 在 剩 下 的 数字 里 继续 寻找 最 小 数 ， 再 将 
它 和 左边 第 2 个 数字 交换 位 置 。 于 是 ，4 和 13 也 交换 了 位 置 。 


我 们 将 这 样 的 一 次 交换 称 为 “1 轮 "。 到 了 第 轮 的 时 候 ， 就 把 剩 下 的 数字 中 最 小 的 一 个 ， 
与 左边 开始 第 个 数字 进行 交换 。 ws 从 左 数 的 个 数字 便 都 按 从 小 到 大 的 
顺序 排列 了 。 只 要 将 这 个 步 驴 重 复 n 次， 那么 所 有 的 数字 都 将 按 从 小 到 大 的 顺序 排列 。 

这 便 是 我 们 将 在 2-3 节 中 介绍 的 选择 排序 。 不 管 输入 的 数字 是 什么 、n 有 多 大 ， 都 可 以 用 这 
个 算法 解决 问题 。 
> 用 计算 机 能 理解 的 方式 构思 解法 : 算法 的 设计 

计算 机 擅长 高 速 执行 一 些 基本 命令 ， 但 无 法 执行 复杂 的 命令 。 此 处 的 “基本 命令 ” 指 的 是 


“做 加 法 ”或 者 “在 指定 的 内 存 地 址 上 保存 数据 ”等 。 
计算 机 是 以 这 些 基 本 命令 的 组 合 为 基础 运行 的 ， 面 对 复杂 的 操作 ， 也 是 通过 搭配 组 合 这 些 
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基本 命令 来 应 对 
何 设计 算法 来 解决 这 个 排序 问题 ， 





令 来 实现 这 个 操作 。 


四 如何 选择 算法 


能 解决 排序 问题 的 算法 不 止 选 择 排序 这 一 个 。 那 么 ， 当 有 多 个 算法 都 可 以 解决 同一 个 问题 
时 ， 我 们 该 如 何 选择 呢 ? 在 算法 的 评判 上 ， 考 量 的 标准 也 各 有 不 同 。 

比如 ， 简 单 的 算法 对 人 来 说 易于 理解 ， 也 容易 被 写成 程序 ， 而 在 运行 过 程 中 不 需要 耗费 太 
多 空间 资源 的 算法 ， 就 十 分 适用 于 内 存 小 的 计算 机 。 

不 过 ， 一 般 来 说 我 们 最 为 重视 的 是 算法 的 运行 时 间 ， 即 从 输入 数据 到 输出 结果 这 个 过 程 所 
花费 的 时 间 。 





的 。 上 文中 提 到 的 “对 个 数字 进行 排序 ”对 计算 机 来 说 就 是 复杂 的 操作 。 如 
也 就 等 同 于 构思 如 何 搭配 组 合计 算 机 可 以 执行 的 那些 基本 命 


























1 对 50 个 数字 排序 所 花 的 时 间 竟 然 比 宇宙 的 历史 还 要 长 吗 


> 使 用 全 排列 算法 进行 排序 


为 了 让 大 家 








休会 一 下 低 效率 算法 的 效果 ， 这 里 来 看 看 下 男 








j 这 个 排序 算法 。 











(D2 


威 到 但 





























7 个 数字 构成 的 数列 ( 不 和 前 面 生成 的 数列 重复 ) 
@ 如 果 中 中 生成 的 数列 按 从 小 到 大 的 顺序 排列 就 将 其 输出 ， 否 则 














我 们 就 把 这 个 算法 称 为 “全 排列 算法 ” 吧 。 全 排列 算法 列 出 了 所 有 的 排列 方法 ， 所 以 不 管 
输入 如 何 ， 都 可 以 得 到 正确 的 结果 。 


那么 ， 



































需要 等 多 久 才能 出 结果 呢 ? 若 运 气 好 ， 很 快 就 能 出 现 正 确 排列 的 话 ， 结 果 也 就 立马 





出 来 了 。 然 而 ， 实 际 情 况 往往 并 不 如 我 们 所 愿 。 最 差 的 情况 ， 也 就 是 直到 最 后 才 出 现 正确 排列 
的 情况 下 ， 计 算 机 就 不 得 不 确认 所 有 可 能 的 排列 了 。 
n 个 数字 有 nl! 种 不 同 的 排列 方法 (nl=n(n-1)(n 一 2)…3 2: 1)。 现在 ,我们 来 看 看 n=50 





时 是 怎样 一 种 情况 吧 。 


























(50!=50.49.48…3. .2.1 
50. 49 .48…3 .2.1>50.49.48…13 .12.11 
50 .49 .48…13 .12 .11 > 102” 
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公式 中 中 ，50! 即 为 数字 1 到 数字 50 的 乘积 。 为 了 便于 计算 ,我 们 通过 公式 3 将 结果 近 
似 转换 为 10 的 次 方 的 形式 。 公 式 @ 右 边 部 分 去 掉 了 10 以 下 的 数字 ， 因 此 小 于 50!。 公 式 @ 左 
右 都 是 40 个 数字 的 乘积 ， 但 左边 数字 都 大 于 10， 因 此 大 于 右边 的 10”。 接 下 来 我 们 就 用 108 近 
似 代表 50 个 数字 的 所 有 排列 情况 来 进行 计算 。 

假设 1 台 高 性 能 计算 机 1 秒 能 检查 1 万 亿 ( =10”) 个 数列 ， 那 么 检查 10” 个 数列 将 花费 的 
时 间 为 10”=10*=10” 秒 。1 年 为 31 536 000 秒 , 不 到 10 秒 。 因 此 ，10” 秒 > 10” 年 。 

从 大 爆炸 开始 宇宙 已 经 经 历 了 约 137 亿 年 ， 即 便 如 此 也 少 于 101 年 。 也 就 是 说 ， 仅 仅 是 
对 50 个 数字 进行 排序 ， 若 使 用 全 排列 算法 ， 就 算 花费 宇宙 年 龄 的 10" 倍 时 间 也 得 不 出 答案 。 


1 ~ 50 


开始 对 50 个 
数字 排序 
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> 使 用 选择 排序 算法 进行 排序 

那么 ， 使 用 前 文 提 到 的 选择 排序 算法 ， 情 况 又 将 如 何 呢 ? 

首先 ， 为 了 在 第 1 轮 找 到 最 小 的 数字 ， 需 要 从 左 往 右 确认 数列 中 的 数字 ， 只 要 查询 个 数 
字 即 可 。 在 接 下 来 的 第 2 轮 中 ,需要 从 -1 个 数字 中 寻找 最 小 值 ， 所 以 需要 查询 n-1 个 数字 。 
将 这 个 步 又 进行 到 第 n 轮 的 时 候 ， 需 要 查询 的 次 数 如 下 。 


n(n+l1) ee 


n+(n—1)+(n—2)+…3+2+1= 


n=50 的 时 候 叉 =2500。 假设 1 秒 能 确认 1 万 亿 (=10" ) 个 数字 ， 那么 2500 = 102=0.000 000 002 5 
秒 便 能 得 出 结果 ， 比 全 排列 算法 的 效率 高 得 多 。 





图 灵 社 区 会 员 夏 科 (1306027770@qq.com) 专 享 尊重 版 权 





运行 时 间 的 计算 方法 


1 了 和 解 输入 数据 的 量 和 运行 时 间 之 间 的 关系 


上 一 节 在 结尾 说 明了 算法 的 不 同 会 导致 其 运行 时 间 产 生 大 幅 变化 ， 本 节 将 讲解 如 何 求 得 
法 的 运行 时 间 。 

使 用 相同 的 算法 ， 输 入 数据 的 量 不 同 ， 运 行 时 间 也 会 不 同 。 比 如 ， 对 10 个 数字 排序 和 
对 1 000 000 个 数字 排序 ， 大 家 很 容易 就 想到 后 者 的 运行 时 间 更 长 。 那 么 ， 实 际 上 运行 时 间 
会 长 多 少 呢 ? 后 者 是 前 者 的 100 倍 ， 还 是 1 000 000 倍 ? 就 像 这 样 ， 我 们 不 光 要 理解 不 同 算 
法 在 运行 时 间 上 的 区 别 ， 还 要 了 人 解 根据 输入 数据 量 的 大 小 ， 算 法 的 运行 时 间 具 体会 产生 多 大 
的 变化 。 





洋 斗 粮 半 个 盏 字 冲 池 




















1 如 何 求 得 运行 时 间 








那么 ， 如 何 测算 不 同 输入 所 导致 的 运行 时 间 的 变化 程度 呢 ? 最 为 现实 的 方法 就 是 在 计算 机 
上 和 运行 一 下 程序 ， 测 试 其 实际 花费 的 时 间 。 但 是 ， 就 算 使 用 同样 的 算法 ， 花 费 的 时 间 也 会 根据 
所 用 计算 机 的 不 同 而 产生 偏差 ,十 分 不 便 。 

所 以 在 这 里 ,我 们 使 用 “ 步 数 ”来 描述 运行 时 间 。“1 步 ” 就 是 计算 的 基本 单位 。 通 过 测试 
“计算 从 开始 到 结束 总 共 执 行 了 多 少 步 ”来 求 得 算法 的 运行 时 间 。 

作为 示例 ， 现 在 我 们 试 着 从 理论 层面 求 出 选择 排序 的 运行 时 间 。 选 择 排序 的 步骤 如 

































































db 从 数列 中 寻找 最 小 值 
QQ 将 最 小 值 和 数列 最 左边 的 数字 进行 交换 ， 排 序 结束 。 回 到 中 ) 












































如 果 数 列 中 有 个 数字 ,那么 由 中 “寻找 最 小 值 ”的 步骤 只 需 确 认 半 个 数字 即 可 。 这 里 ， 将 
“确认 1 个 数字 的 大 小 ”作为 操作 的 基本 单位 ， 需 要 的 时 间 设 为 到 ,那么 步骤 中 的 运行 时 间 就 是 
nxTo 

接 下 来 ,把 “对 两 个 数字 进行 交换 ”也 作为 操作 的 基本 单位 ， 需 要 的 时 间 设 为 7。 那 
么 ， DD 种 总 共 重 复 n 次 ,每 经 过 “1 轮 "， 需 要 查找 的 数字 就 减少 1 个 ， 因 此 总 的 运行 时 间 如 下 。 
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T.n(nt+l1)+Tn 
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I! 
TT 





虽说 只 剩 最 后 1 个 数字 的 时 候 就 不 需要 确认 了 ,但 是 方便 起 见 还 是 把 对 它 的 确认 和 交换 时 
间 计算 在 内 比较 好 。 


1 运行 时 间 的 表示 方法 


虽说 我 们 已 经 求 得 了 运行 时 间 ,， 但 其 实 这 个 结果 还 可 以 简化 。Z. 和 工 都 是 基本 单位 ， 与 输 
入 无 天 。 会 根据 输入 变化 而 变化 的 只 有 数列 的 长 度 n， 所 以 接 下 来 考虑 变 大 的 情况 。n 越 大 ， 
上 式 中 的 普 也 就 越 大 ， 其 他 部 分 就 相对 变 小 了 。 也 就 是 说 ， 对 式 子 影响 最 大 的 是 辫 。 所 以 , 我 
们 删 掉 其 他 部 分 ， 将 结果 表示 成 下 式 右 边 的 形式 。 





LN 
通过 这 种 表示 方法 ， 我 们 就 能 大 至 了解 到 排序 算法 的 运行 时 间 与 输入 数据 量 n 的 平方 成 正比 。 
同样 地 ,假设 某 个 算法 的 运行 时 间 如 下 。 


SE m+127, m+3T.n 






































那么 ， 这 个 结果 就 可 以 用 O(n') 来 表示 。 如 果 运 行 时 间 为 





3nlogn+2T,n 


这 个 结果 就 可 以 用 O(nlogn) 来 表示 。 

O 这 个 符号 的 意思 是 “忽略 重要 项 以 外 的 内 容 ”， 读 音 同 Order。O(z 的 含义 就 是 “算法 的 
运行 时 间 最 长 也 就 是 xw 的 常数 倍 ”， 准 确 的 定义 请 参考 相关 专业 书籍 。 重 点 在 于 ， 通 过 这 种 表示 
方法 ,我 们 可 以 直观 地 了 解 算法 的 时 间 复 杂 度 "。 

比如 ， 当 我 们 知道 选择 排序 的 时 间 复 杂 度 为 O(n”)、 快 速 排 序 的 时 间 复 杂 度 为 O(nlogn) 时 ， 很 
快 就 能 判断 出 快速 排序 的 运算 更 为 高 速 。 二 者 的 运行 时 间 根 据 输入 产生 的 变化 程度 也 一 目 了 然 。 

关于 算法 的 基本 知识 就 介绍 到 这 里 了 。 从 下 一 章 开始 ， 我 们 就 来 具体 学 习 各 种 算法 吧 。 























QD 时间 复 杂 度 是 一 个 可 以 描述 算法 运行 时 间 的 函数 ， 常 用 大 O 符号 来 表述 。 一 一 译 者 注 














数据 结构 





什么 是 数据 结 


1 决定 了 数据 的 顺序 和 位 置 关系 


数据 存储 于 计算 机 的 内 存 中 。 内 存 如 右 图 所 示 ， 形 似 排 成 1 列 的 箱 
子 ，1 个 箱子 里 存储 1 个 数据 。 - 

数据 存储 于 内 存 时 ， 决 定 了 数据 顺序 和 位 置 关系 的 便 是 “数据 结构 ”。 数据 

数据 

电话 牌 的 数据 结构 
》 例 中 从 上 往 下 顺序 添加 

举 个 简单 的 例子 。 假 设 我 们 有 1 个 电话 蚕 一 “虽说 现在 很 多 人 都 把 电话 号 码 存在 手机 里 ， 
但 是 这 里 我 们 考虑 使 用 纸 质 电话 德 的 情况 _ 每 当 我 们 得 到 了 新 的 电话 号 码 ， 就 按 从 上 往 下 的 
顺序 把 它们 记 在 电话 德 上 。 


内 存 





























电话 号 码 


010-uuuu-uuuu 























010-XXXX-XXXX 











O010-yyyy-yyyy 
021-ZZZZ-ZZZZ 


























假设 此 时 我 们 想 给 “ 张 伟 ” 打 电话 ， 但 是 因为 数据 都 是 按 获取 顺序 排列 的 ， 所 以 我 们 并 不 
知道 张 伟 的 号 码 具 体 在 哪里 ， 只 能 从 头 一 个 个 往 下 找 (虽说 也 可 以 “从 后 往 前 找 ” 或 者 “随机 
查找 ", 但 是 效率 并 不 会 比 “ 从 上 往 下 找 ” 高 )。 如 果 电 话 短 上 号 码 不 多 的 话 很 快 就 能 找到 ,但 
如 果 存 了 500 个 号 码 ， 找 起 来 就 不 那么 容易 了 。 


* 例 @ 按 姓名 的 拼音 顺序 排列 


接 下 来 ， 试 试 以 联系 人 姓名 的 拼音 顺序 排列 吧 。 因 为 数据 都 是 以 字典 顺序 排列 的 ， 所 以 它 
们 是 有 “结构 ”的 。 





























电话 号 码 
010-aaaa-aaaa 
010-bbbb-bbbb 


020-zzzz-zzzz 



































010-cccc-cccc 

















使 用 这 种 方式 给 联系 人 排序 的 话 ， 想 要 找到 目标 人 物 就 轻松 多 了 。 通 过 姓名 的 拼音 首 字母 
就 能 推测 出 该 数据 的 大 致 位 置 。 

那么 ， 如 何 往 这 个 按 拼 音 顺 序 排 列 的 电话 短 里 添加 数据 呢 ? 假设 我 们 认识 了 新 朋友 “ 柯 津 
博 ” 并 拿 到 了 他 的 电话 号 码 ， 打 算 把 号 码 记 到 电话 短 中 。 由 于 数据 按 姓名 的 拼音 顺序 排列 ， 所 
以 柯 津 博 必 须 写 在 韩 宏 宇 和 李 希 之 间 , 但 是 上 面 的 这 张 表 里 已 经 没有 空位 可 供 填写 ， 所 以 需要 
把 李 硕 及 其 以 下 的 数据 往 下 移 1 行 。 
此 时 我 们 需要 从 下 往 上 执行 “将 本 行 的 内 容 写 进 下 一 行 ， 然 后 清除 本 行内 容 ” 的 操作 。 如 
果 一 共有 500 个 数据 ， 一 次 操作 需要 10 秒 ， 那 么 1 个 小 时 也 完成 不 了 这 项 工作 。 



































> 两 种 方法 的 优 缺 点 

总 的 来 说 ， 数 据 按 获取 顺序 排列 的 话 ， 虽 然 添加 数据 非常 简单 ， 只 需要 把 数据 加 在 最 后 就 
可 以 了 ,但 是 在 查询 时 较为 麻烦 ; 以 拼音 顺序 来 排列 的 话 ， 虽 然 在 查询 上 较为 简单 ， 但 是 添加 
数据 时 又 会 比较 麻烦 。 

虽说 这 两 种 方法 各 有 各 的 优 缺 点 ， 但 具体 选择 哪 种 还 是 要 取决 于 这 个 电话 短 的 用 法 。 如 果 
电话 憩 做 好 之 后 就 不 再 添加 新 号 码 ， 那 么 选择 后 者 更 为 合适 ; 如 果 需 要 经 常 添加 新 号 码 ， 但 不 
怎么 需要 再 查询 ， 就 应 该 选择 前 者 。 
































> 将 获取 顺序 与 拼音 顺序 结合 起 来 怎么 样 


我 们 还 可 以 考虑 一 种 新 的 排列 方法 ， 将 二 者 的 优点 结合 起 来 。 那 就 是 分 别 使 用 不 同 的 表 存 储 
不 同 的 拼音 首 字 母 ， 比 如 表 L、 表 M、 表 NN 等 ， 然 后 将 同一 张 表 中 的 数据 按 获取 顺序 进行 排列 。 





表 [ 





电话 号 码 
010-aaaa-aaaa 
010-bbbb-bbbb 


021-zzzz-zzzz 




















010-ccc-cccc 























电话 号 码 


010-aaaa-aaaa 














021-zzzz-zzzz 











010-zzzz-zzzz 











010-aaaa-aaaa 


























021-aaaa-aaaa 


























这 样 一 来 ， 在 添加 新 数据 时 ， 直 接 将 数据 加 入 到 相应 表 中 的 末尾 就 可 以 了 ， 而 查询 数据 时 ， 
也 只 需要 到 其 对 应 的 表 中 去 查找 即 可 。 

因为 各 个 表 中 存储 的 数据 依旧 是 没有 规律 的 ， 所 以 查询 时 仍 需 从 表 头 开始 找 起 ， 但 比 碍 询 
整个 电话 憩 来 说 还 是 要 轻松 多 了 。 








1 选择 合适 的 数据 结构 以 提高 内 存 的 利用 率 


数据 结构 方面 的 思路 也 和 制作 电话 适时 的 一 样 。 将 数据 存储 于 内 存 时 ， 根 据 使 用 目的 选择 
合适 的 数据 结构 ， 可 以 提高 内 存 的 利用 率 。 

本 章 将 会 讲解 7 种 数据 结构 。 如 本 节 开 头 所 述 ， 数 据 在 内 存 中 是 呈 线 性 排列 的 ， 但 是 我 们 
也 可 以 使 用 指针 等 道具 ， 构 造 出 类 似 “ 树 形 ”的 复杂 结构 〈 树 形 结构 将 在 4-2 节 详 细 说 明 )。 
〇 参考: 4-2 广度 优先 搜索 
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链表 是 数据 结构 之 一 ， 其 中 的 数据 呈 线 性 排列 。 在 链表 中 ， 数 据 的 添加 和 删除 都 较为 方便 ， 
就 是 访问 比较 耗费 时 间 。 





Red 是 最 后 1 个 数据 ， 所 以 
| Red 是 Red 的 指针 不 指向 任何 位 置 。 


指针 指针 














这 就 是 链表 的 概念 图 。Blue、Yellow、Red 这 3 个 字符 串 作为 数据 被 存储 于 链表 中 。 每 个 数据 都 
“指针 "， 它 指向 下 一 个 数据 的 内 存 地 址 。 





























顺序 访问 


Ea ET 


| pointer | 





在 链表 中 ， 数 据 一 般 都 是 分 散 存 储 于 内 存 9 ”因为 数据 都 是 分 散 存 储 的 ， 所 以 如 果 想 要 访问 
的 ， 无 须 存储 在 连续 空间 内 。 数据 ， 只 能 从 第 1 个 数据 开始 ， 顺 着 指针 的 指 
向 一 一 往 下 访问 ( 这 便 是 顺序 访问 )。 比 如 , 想 
要 找到 Red 这 一 数据 ， 就 得 从 Blue 开始 访问 。 



































顺序 访问 


ES 


这 之 后 , 还 要 经 过 Yellow, 我 们 才能 找到 Red。 


1 EFF 


Green 邮 


将 Blue 的 指针 指向 的 位 置 变 成 Green， 然 后 再 
把 Green 的 指针 指向 Yellow， 数 据 的 添加 就 大 
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0 与 
IE- CT EE 


EE 
如 果 想 要 添加 数据 ， 只 需要 改变 添加 位 置 前 后 


的 指针 指向 就 可 以 ， 非 常 简单 。 比 如 ， 在 Blue 
和 Yellow 之 间 添 加 Green。 











& Ty 
| ET 


| 
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数据 的 删除 也 一 样 ， 只 要 改变 指针 的 指向 就 可 
以 ， 比 如 删除 Yellow。 








emt re | 


cn | 





这 时 ， 只 需要 把 Green 指针 指向 的 位 置 从 Yellow 变 成 Red， 删 除 就 完成 了 。 虽 然 Yellow 本 身 还 存储 在 





内 存 中 ， 但 是 不 管 从 哪里 都 无 法 访问 这 个 数据 ， 所 以 也 就 没有 特意 去 删除 它 的 必要 了 。 今 后 需要 用 到 


























Yellow 所 在 的 存储 空间 时 ， 只 要 用 新 数据 覆盖 掉 就 可 以 了 。 

















对 链表 的 操作 所 需 的 运行 时 间 到 底 是 多 少 呢 ? 在 这 里 ， 我 们 把 链表 中 的 数据 量 记 成 
no 访问 数据 时 ， 我 们 需要 从 链表 头 部 开始 查找 ( 线性 查找 )， 如 果 目 标 数据 在 链表 最 后 
的 话 ， 需 要 的 时 间 就 是 O(n)。 
另外 ， 添 加 数据 只 需要 更 改 两 个 指针 的 指向 ， 所 以 耗费 的 时 间 与 无关。 如 果 已 
经 到 达 了 添加 数据 的 位 置 ， 那 么 添加 操作 只 需 花 费 O(1) 的 时 间 。 删 除数 据 同样 也 只 需 
0O(1) 的 时 间 。 
参考 : 3-1 线性 查找 


























>” 补充 说 明 


上 文中 讲述 的 链表 是 最 基本 的 一 种 链表 。 除 此 之 外 ， 还 存在 几 种 扩展 方便 的 链表 。 

虽然 上 文中 提 到 的 链表 在 尾部 没有 指针 ， 但 我 们 也 可 以 在 链表 尾部 使 用 指针 ， 并 

让 它 指向 链表 头 部 的 数据 ， 将 链表 变 成 环形 。 这 便 是 “循环 链表 ”， 也 叫 “ 环 形 链表 ”。 

循环 链表 没有 头 和 尾 的 概念 。 想 要 保存 数量 固定 的 最 新 数据 时 通常 会 使 用 这 种 链表 。 
循环 链表 


Er Cr ED 


另外 ， 上 文 链表 里 的 每 个 数据 都 只 有 一 个 指针 ， 但 我 们 可 以 把 指针 设 定 为 两 个 ， 并 
让 它们 分 别 指向 前 后 数据 ， 这 就 是 “双向 链表 ”。 使 用 这 种 链表 ， 不 仅 可 以 从 前 往 后 ， 
还 可 以 从 后 往 前 遍历 数据 ， 十 分 方便 。 

但 是 ， 双 向 链表 存在 两 个 缺点 : 一 是 指针 数 的 增加 会 导致 存储 空间 需求 增加 ， 二 是 
添加 和 删除 数据 时 需要 改变 更 多 指针 的 指向 。 
双向 链表 





































































































9 之 SLC 之。 








数组 也 是 数据 呈 线 性 排列 的 一 种 数据 结构 。 与 前 一 节 中 的 链表 不 同 ， 在 数组 中 ,访问 数据 十 分 
简单 ， 而 添加 和 删除 数据 比较 耗 工夫 。 这 和 1-1 节 中 讲 到 的 姓名 按 拼音 顺序 排列 的 电话 敌 类 似 。 
CC 参考: 1-1 什么 是 数据 结构 


4 是 数组 的 名 字 , 后 面 “[]” 中 的 数字 表示 该 数 
al0] all] al2] 据 是 数组 中 的 第 几 个 数据 ( 这 个 数字 叫 作 “ 数 


ET EEC 性 晴 。 组 下 标 ， 下 标 人 0 开始 计数 ) 比如 ，Red 训 


是 数组 a 的 第 2 个 数据 。 








这 就 是 数组 的 概念 图 。Blue、Yellow、Red 作为 数据 存储 在 数组 上 
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数据 按 顺 序 存储 在 内 存 的 连续 空间 内 。 于 数据 是 存储 在 连续 空间 内 的 ， 所 以 每 个 数 
据 的 内 存 地 址 ( 在 内 存 上 的 位 置 ) 都 可 以 通过 
数组 下 标 算出 ， 我 们 也 就 可 以 借 此 直接 访问 
标 数据 ( 这 叫 作 “随机 访问 ”)。 































































































ao am al 


ET CT ED 











比如 现在 我 们 想 要 访问 Red。 如 果 使 用 指针 就 
只 能 从 头 开始 查找 ， 但 在 数组 中 ， 只 需要 指定 
a[2]， 便 能 直接 访问 Red。 















































a[0] a[1] a[2] 4a[3] 


ET PT ES/ 


首先 ， 在 数组 的 末尾 确保 需要 增加 的 存储 空间 。 











a[0] al1] 4a[2] 4a[3] 


Er Cn EN 








然后 把 Yellow 往 后 移 。 





a[0] 4a[1] 4[2] 


ET CID IE 


Green 


但 是 ， 如 果 想 在 任意 位 置 上 添加 或 者 删除 数 
居 ， 数组 的 操作 就 要 比 链表 复杂 多 了 。 这 里 我 
门 尝试 将 Green 添 加 到 第 2 个 位 置 上 。 

















a[0] al1] a[2] a[3] 


ED [aa aa :… 


为 了 给 新 数据 腾 出 位 置 ， 要 把 已 有 数据 一 个 个 
开 。 首 先 把 Red 往 后 移 。 



































4[0] 4a[1] a[2] a[3] 


aue .| CT EN 














来 的 位 置 上 写 入 Green。 








添加 数据 的 操作 就 完成 了 。 


al0 


\1y 
] a[1] 4a[2] 


4[0] al1] 


a[2] a[3] 


ET CE CT ED 


al[3] 


ET CE CT ED 


al0 


Er 





然后 把 后 面 的 数据 一 个 个 往 
主 前 移 。 


Yellow 行 


Green 


] a[1] a[2] 


4[3] 


FE 空位 移 。 先 把 








4[0] a[1] 4[2] 4[3] 


标 数据 ( 在 这 里 指 Green )。 


























a[0] a[1] a[2] 4a[3] 


EECO ES | 


接 下 来 移动 Red。 





Green 


a[0] a[1] 4a[2] 4a[3] 


ET CT ED 




















余 的 空间 。 这 样 一 来 Green 便 被 删 掉 了 。 

















这 里 讲解 一 下 对 数组 操作 所 花费 的 运行 时 间 。 假 设 数组 中 有 个 数据 ， 由 于 访问 数 
据 时 使 用 的 是 随机 访问 (通过 下 标 可 计算 出 内 存 地 址 )， 所 以 需要 的 运行 时 间 仅 为 恒定 的 





Qlpie 








但 另 一 方面 ， 想 要 向 数组 中 添加 新 数据 时 ， 必 须 把 目标 位 置 后 








开 。 所 以 ， 如 果 在 数组 头 部 添加 数据 ， 就 需要 O(n) 的 时 间 。 删 除 操 { 


> 补充 说 明 











的 数据 一 个 个 移 


在 链表 和 数组 中 ， 数 据 都 是 线性 地 排 成 一 列 。 在 链表 中 访问 数据 较为 复杂 ， 添 加 和 
删除 数据 较为 简单 ;而 在 数组 中 访问 数据 比较 简单 ， 添 加 和 删除 数据 却 比 较 复杂 。 





我 们 可 以 根据 哪 种 操作 较为 频繁 来 决定 使 用 哪 种 数据 结构 。 





访问 ; 删除 
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快 
































栈 也 是 一 种 数据 呈 线 性 排列 的 数据 结构 ， 不 过 在 这 种 结构 中 ,我 们 只 能 访问 最 新 添加 的 数 
据 。 栈 就 像 是 一 操 书 ， 拿 到 新 书 时 我 们 会 把 它 放 在 书 堆 的 最 上 面 ， 取 书 时 也 只 能 从 最 上 面 的 新 
书 开始 取 。 


往 栈 中 添加 数据 的 时 候 , 新 数 
据 被 放 在 最 上 面 。 





念 图 。 现 在 存储 在 栈 中 的 只 
































往 栈 中 添加 数据 
的 操作 叫 作 “入 
栈 ”( push )。 





然后 ， 栈 中 添加 了 数据 Green。 ，。 接 下 来 ， 数 据 Red 入 栈 。 





从 栈 中 取 昌 
数据 的 操 f 
叫 作 “出 栈 ” 
( pop ) 











从 栈 中 取出 数据 时 ， 是 从 最 上 面 ， 也 就 是 最 新 ”， ”如 果 再 进行 一 次 出 栈 操作 ， 取 出 的 就 是 Green 了 。 
的 数据 开始 取出 的 。 这 里 取出 的 是 Red。 ， 





























像 栈 这 种 最 后 添加 的 数据 最 先 被 取出 ， 即 “后 进 先 出 ”的 结构 ， 我 们 称 为 Last In 
First Out， 简 称 LIFO。 
与 链表 和 数组 一 样 ， 栈 的 数据 也 是 线性 排列 ， 但 在 栈 中 ， 添 加 和 删除 数据 的 操作 只 
在 一 端 进行 ， 访 问 数 据 也 只 能 访问 到 顶端 的 数据 。 想 要 访问 中 间 的 数据 时 ， 就 必须 通 

过 出 栈 操作 将 目标 数据 移 到 栈 项 才 行 。 














> 应 用 示例 











栈 只 能 在 一 端 操 作 这 一 点 看 起 来 似乎 十 分 不 便 ， 但 在 只 需要 访问 最 新 数据 时 ， 使 用 
时 有 人 便 届 本 

比如 ， 规 定 (AB (C (DE)F)(G ((H)1IJ) KK)) 这 一 串 字 符 中 括号 的 处 理 方式 
如 下 : 首先 从 左边 开始 读 取 字符 ， 读 到 左 括号 就 将 其 入 栈 ， 读 到 右 括 号 就 将 栈 顶 的 左 括 
号 出 栈 。 此 时 ， 出 栈 的 左 括号 便 与 当前 读 取 的 右 括号 相 匹 配 。 通 过 这 种 处 理 方式 ， 我 们 
就 能 得 知 配对 括号 的 具体 位 置 。 

另外 ， 我 们 将 要 在 4-3 节 中 学 习 的 深度 优先 搜索 算法 ， 通 常会 选择 最 新 的 数据 作为 
候补 项 点。 在 候补 顶点 的 管理 上 就 可 以 使 用 栈 。 
人 参考: 4-3 深度 优先 搜索 

























































































与 前 面 提 到 的 数据 结构 相同 ， 队 列 中 的 数据 也 呈 线 性 排列 。 虽 然 与 栈 有 些 相 似 ， 但 队列 中 
添加 和 删除 数据 的 操作 分 别 是 在 两 端 进行 的 。 就 和 “队列 ”这 个 名 字 一 样 ， 把 它 想象 成 排 成 一 
队 的 人 更 容易 理解 。 在 队列 中 ， 处 理 总 是 从 第 一 名 开始 往 后 进行 ， 而 新 来 的 人 只 能 排 在 队 尾 。 


往 队 列 中 添加 数据 时 , 数据 被 





ET [在 最 上 面 。 




















这 就 是 队列 的 概念 图 。 现 在 队列 中 只 有 数据 Blue。 





往 队 列 中 添加 
数据 的 操作 叫 
作 “ 公 也" 








紧 接 着 ， 数 据 Red 也 入 队 了 。 
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从 队列 中 删除 ' 队 
数据 的 操作 叫 列 


| Red | 和信“ 此 耻 % 





Blue | : Green 


从 队列 中 取出 ( 删除 ) 数据 时 , 是 从 最 下 面 , 也 就 ” ， ”如 果 再 进行 一 次 出 队 操 作 ， 取 出 的 就 是 Green 了 。 
是 最 早 入 队 的 数据 开始 的 。 这 里 取出 的 是 Blue。 

































































像 队 列 这 种 最 先进 去 的 数据 最 先 被 取 来 ， 即 “先进 先 出 ”的 结构 ， 我 们 称 为 First In 
First Out， 简 称 FIFO。 

与 栈 类 似 ， 队 列 中 可 以 操作 数据 的 位 置 也 有 一 定 的 限制 。 在 栈 中 ， 数 据 的 添加 和 删 
除 都 在 同一 端 进行 ， 而 在 队列 中 则 分 别 是 在 两 端 进行 的 。 队 列 也 不 能 直接 访问 位 于 中 间 
的 数据 ， 必 须 通 过 出 队 操作 将 目标 数据 变 成 首位 后 才能 访问 。 





























> 应 用 示例 











“ 先 来 的 数据 先 处 理 ” 是 一 种 很 常见 的 思路 ， 所 以 队列 的 应 用 范围 非常 广泛 。 比 如 
4-2 节 中 将 要 讲解 的 广度 优先 搜索 算法 ， 通 常 就 会 从 搜索 候补 中 选择 最 早 的 数据 作为 下 
一 个 项 点。 此 时 ， 在 候补 项 点 的 管理 上 就 可 以 使 用 队列 。 
参考 : 4-2 广度 优先 搜索 


























luvo 





在 哈 希 表 这 种 数据 结构 中 ， 使 用 将 在 5-3 节 讲 解 的 “ 哈 希 函数 "”， 可 以 使 数据 的 查询 效率 得 
到 显著 提升 。 
参考 : 5-3 哈 希 函 数 


M 表示 性 
别 为 男 ,F 
表示 性 别 
为 女 。 


My 
My] 
My] 














哈 希 表 存 储 的 是 由 键 ( key ) 和 值 (value ) 组 ”， ”为 了 和 哈 希 表 进 行 对 比 ， 我 们 先 将 这 些 数 扩 
成 的 数据 。 例 如 ， 我 们 将 每 个 人 的 性 别 作为 数 储 在 数组 中 ( 数组 的 讨 
居 进 行 存储 ， 键 为 人 名 ， 值 为 对 应 的 性 别 。 ! ”参考 : 1-3 数组 









































此 处 准备 了 6 个 箱子 ( 即 长 度 为 6 的 数组 ) 来 存 
储 数据 。 假 设 我 们 需要 查询 Ally 的 性 别 ， 由 于 
不 知道 Ally 的 数据 存储 在 哪个 箱子 里 ， 所 以 只 
能 从 头 开 始 查询 。 这 个 操作 便 叫 作 “ 线 性 查找 ” 
( 线性 查找 的 讲解 在 3-1 节 )。 

他 参考 : 3-1 线性 查找 















































一 般 来 说 ， 我 们 可 以 把 键 当 成 数据 的 标识 符 ， 把 值 当 成 数据 的 内 容 。 


























f，2 号 、3 号 箱子 中 的 也 都 不 是 Ally。 ，， 查找 到 4 号 箱子 的 时 候 ， 发 现 其 中 数据 的 键 为 
， Ally。 把 键 对 应 的 值 取出 , 我 们 就 知道 Ally 的 性 
别 为 女 (F ) 了 。 
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数据 量 越 多 ， 线 性 查找 耗费 的 时 间 就 越 长 。 由 。 ， 但 使 用 哈 希 表 便 可 以 解决 这 个 问题 。 首 先 准 
此 可 知 ; 由 于 数据 的 查询 较为 耗 时 ， 所 以 此 处 ，” 备 好 数组 ， 这 次 我 们 用 5 个 箱子 的 数组 来 存储 
并 不 适合 使 用 数组 来 存储 数 ， : 






















































































尝试 把 Joe 存 进去 。 ， ”使 用 哈 希 函数 ( Hash ) 计算 Joe 的 键 ， 也 就 是 
字符 串 “Joe” 的 哈 希 值 。 得 到 的 结果 为 4928 
( 哈 希 函数 的 详细 说 明 在 5-3 节 )。 
参考 : 5-3 哈 希 函数 











0 
2 
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但 | | 


四 周一 2 mod 5=3 





淋 引 寅 





将 得 到 的 哈 希 值 除 以 数组 的 长 度 5， 求 得 其 余  ， 我 们 将 Joe 的 数据 存 进 数 组 的 3 号 箱 
数 。 这 样 的 求 余 运 算 叫 作 “mod 运 算 ”。 此 处 I E 复 前 面 的 操作 ， 将 其 他 数据 也 存 进 数 
mod 运 算 的 结果 为 3。 ! 


























Sue 键 的 哈 希 值 为 7291，mod 5 的 结果 为 1， ， ”Dan 键 的 哈 希 值 为 1539，mod 5 的 结果 为 4， 
将 Sue 的 数据 存 进 1 号 箱 中 。 ， ”将 Dan 的 数据 存 进 4 号 箱 中 。 
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6276mod5=1 


Nell 键 的 哈 希 值 为 6276，mod 5 的 结果 为 1。 本 应 将 其 存 进 数组 的 1 号 箱 中 ， 但 此 时 1 











存储 了 Sue 的 数据 。 这 种 存储 位 置 重复 了 的 情况 便 叫 作 


遇 到 这 种 情况 ， 可 使 用 链表 在 已 有 数据 的 后 面 
继续 存储 新 的 数据 。 关 于 链表 的 详细 说 明 请 见 
1:2%s 

他 参考 : 1-2 链表 




















冲突 ”。 





号 箱 中 已 





Ally 键 的 哈 希 值 为 9143，mod 5 的 结果 为 3。 








本 应 将 其 存储 在 数组 的 3 号 箱 


P ， 但 3 号 第 中 
































已 经 有 了 Joe 的 数据 ， 所 以 使 








链表 ， 在 其 











面 存储 Ally 的 数据 。 
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5278 mod 5=3 


Bob 键 的 哈 希 值 为 5278，mod 5 的 结果 为 3。 
本 应 将 其 存储 在 数组 的 3 号 箱 中 ,但 3 号 箱 中 
已 经 有 了 Joe 和 Ally 的 数据 ， 所 以 使 用 链表 ， 
在 Ally 的 后 面 继续 存储 Bob 的 数据 。 





























接 下 来 讲解 数据 的 查询 方法 。 假 设 我 们 要 查询 
Dan 的 性 别 。 


像 这 样 存 储 完 所 有 数据 ， 哈 希 表 也 就 制作 完 








为 了 知道 Dan 存 储 在 哪个 箱子 里 ， 首 先 需 要 算出 
Dan 键 的 哈 希 值 , 然后 对 其 进行 mod 运 算 。 最 后 得 
到 的 结果 为 4， 于 是 我 们 知道 了 它 存储 在 4 号 箱 中 。 
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回 娃 .ss， mod5=4 








查看 4 号 箱 可 知 , 其 中 的 数据 的 键 与 Dan 一 致 ， ' ”那么 ， 想 要 查询 Ally 的 性 别 时 该 怎么 做 呢 ? 为 
于 是 取出 对 应 的 值 。 由 此 我 们 便 知 道 了 Dan 的 ”' ”了 找到 它 的 存储 位 置 ， 先 要 算出 Ally 键 的 哈 希 
性 别 为 男 ( M )。 ' ， 值 , 再 对 其 进行 mod 运 算 。 最 终 得 到 的 结果 为 3。 



































然而 3 号 箱 中 数据 的 键 是 Joe 而 不 是 Ally。 此 ' ”于 是 我 们 找到 了 键 为 Ally 的 数据 。 取 上 
时 便 需 要 对 Joe 所 在 的 链表 进行 线性 查找 。 ， ”的 值 ， 便 知道 了 Ally 的 性 别 为 女 (F )。 
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在 哈 希 表 中 ， 我 们 可 以 利用 哈 希 函数 快速 访问 到 数组 中 的 目标 数据 。 如 果 发 生 哈 希 
冲突 ， 就 使 用 链表 进行 存储 。 这 样 一 来 ， 不 管 数据 量 为 多 少 ， 我 们 都 能 够 灵活 应 对 。 

如 果 数 组 的 空间 太 小 ， 使 用 哈 希 表 的 时 候 就 容易 发 生 冲 突 ， 线 性 查找 的 使 用 频率 也 
会 更 高 ; 反 过 来 ， 如 果 数 组 的 空间 太 大 ， 就 会 出 现 很 多 空 箱子 ， 造 成 内 存 的 浪费 。 因 此 ， 
给 数组 设 定 合适 的 空间 非常 重要 。 









































> 补充 说 明 


在 存储 数据 的 过 程 中 ， 如 果 发 生 冲突 ， 可 以 利用 链表 在 已 有 数据 的 后 面 插入 新 数据 
来 解决 冲突 。 这 种 方法 被 称 为 “ 链 地 址 法 ”。 

除了 链 地 址 法 以 外 ， 还 有 几 种 解决 冲突 的 方法 。 其 中 ， 应 用 较为 广泛 的 是 “开放 地 
址 法 "。 这 种 方法 是 指 当 冲突 发 生 时 ， 立 刻 计算 出 一 个 候补 地 址 ( 数组 上 的 位 置 ) 并 将 数 
据 存 进去 。 如 果 仍 然 有 冲突 ， 便 继续 计算 下 一 个 候补 地 址 ， 直 到 有 空地 址 为 止 。 可 以 通 
过 多 次 使 用 哈 希 函数 或 “线性 探测 法 ”等 方法 计算 候补 地 址 。 

另外 ， 本 书 在 5-3 节 关 于 哈 希 函数 的 说 明 中 将 会 提 到 “无 法 根据 哈 希 值 推算 出 原 值 ” 
这 个 条 件 。 不 过 ， 这 只 是 在 把 哈 希 表 应 用 于 密码 等 安全 方面 时 需要 留意 的 条 件 ， 并 不 是 
哈 希 表 时 必须 要 遵守 的 规则 。 
为 为 哈 希 表 在 数据 存储 上 的 灵活 性 和 数据 查询 上 的 高 效 性 ， 编 程 语 言 的 关联 数组 等 
也 常常 会 使 用 它 。 
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堆 是 一 种 图 的 树 形 结构 ， 被 用 于 实现 “优先 队列 ”( priority queues ) ( 树 形 结构 的 详细 讲解 
在 4-2 节 )。 优 先 队列 是 一 种 数据 结构 ， 可 以 自由 添加 数据 ， 但 取出 数据 时 要 从 最 小 值 开 始 按 顺 
序 取出 。 在 堆 的 树 形 结构 中 ， 各 个 顶点 被 称 为 “ 结 点 ”( node )， 数 据 就 存储 在 这 些 结 点 中 。 
CC 参考: 4-1 什么 是 图 
参考 : 4-2 广度 优先 搜索 


在 这 个 例 了 中 到 年 后 反 中 
6，4，8，7 的 顺序 排列 。 





这 就 是 堆 的 示例 。 结 点 内 的 数 
字 就 是 存储 的 数据 。 堆 中 的 每 
两 个 子 结 点 。 树 
的 形状 取决 于 数据 的 个 数 。 另 
外 ， 结 点 的 排列 顺序 为 从 上 到 
下 ， 同 一 行 里 则 为 从 左 到 右 。 



































对 中 存储 数据 时 必须 遵守 这 
样 一 条 规则 : 子 结 点 必定 大 于 父 
结 点 。 因 此 ,最 小 值 被 存储 在 项 
端的 根 结 点 中 。 往 堆 中 添加 数据 
时 ， 为 了 遵守 这 条 规则 ， 一 般 会 
把 新 数据 放 在 最 下 面 一 行 靠 左 
的 位 置 。 当 最 下 面 一 行 里 没有 多 
余 空间 时 ， 就 再 往 下 另 起 一 行 ， 
把 数据 加 在 这 一 行 的 最 左 端 。 






















































































我 们 试 试 往 堆 里 添加 数 





首先 按照 @ 妥 的 说 明 寻 找 新 数据 的 位 置 。 该 图 中 最 如 果 父 结 点 大 于 子 结 点 ， 则 不 符合 上 文 提 到 的 
下 面 一 排 空 着 一 个 位 置 ， 所 以 将 数据 加 在 此 处 。 需要 交换 父子 结 点 的 位 置 。 












































这 里 由 于 父 结 点 的 6 大 于 子 结 点 的 5， 所 以 交 。 ， ”现在 , 父 结 点 的 1 小 于 子 结 点 的 5， 父 结 点 的 数 
换 了 这 两 个 数字 。 重 复 这 样 的 操作 直到 数据 都 ”， ” 字 更 小 ， 所 以 不 再 交换 。 
符合 规则 ， 不 再 需要 交换 为 止 。 
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这 样 ， 往 堆 中 添加 数据 的 操作 就 完成 了 。 





于 最 上 面 的 数据 被 取出 ， 
































如 果子 结 点 的 数字 小 于 父 结 点 的 ， 就 将 父 结 点 





与 其 左右 两 个 子 结 点 中 较 小 的 


此 堆 的 结构 也 需 


2 














i 于 


行 交换 。 








1 数据 时 ， 取 出 的 是 最 上 面 的 数据 。 
二 中 就 能 始终 保持 最 上 面 的 数据 最 小 。 

















按照 中 说 明 的 排列 顺序 , 将 最 后 的 数据 ( 此 
处 为 6 ) 移动 到 最 顶端 。 


的 3, 所 以 将 左边 的 子 结 点 与 父 结 点 进 
重复 这 个 操作 直到 数据 都 符合 规则 ， 不 
再 需要 交换 为 止 。 








9 E SS 


现在 , 子 结 点 ( 右 ) 的 8 大 于 4 这 样 ， 从 堆 中 取出 数据 的 操作 便 完成 了 。 
结 点 ( 左 ) 的 4, 需要 将 左边 的 


进行 交换 。 


中 最 顶端 的 数据 始终 最 小 ， 所 以 无 论 数 据 量 有 多 少 ， 取 出 最 小 值 的 时 间 复 杂 度 都 
OR 

另外 ， 因 为 取出 数据 后 需要 将 最 后 的 数据 移 到 最 顶端 ， 然 后 一 边 比较 它 与 子 结 点 数据 
的 大 小 ， 一 边 往 下 移动 ， 所 以 取出 数据 需要 的 运行 时 间 和 树 的 高 度 成 正比 。 假 设 数据 量 为 
7， 根据 堆 的 形状 特点 可 知 树 的 高 度 为 log ， 那 么 重 构 树 的 时 间 复 杂 度 便 为 O(logn) 。 

添加 数据 也 一 样 。 在 堆 的 最 后 添加 数据 后 ， 数 据 会 一 边 比较 它 与 父 结 点 数据 的 大 
小 ， 一 边 往 上 移动 ， 直 到 满足 堆 的 条 件 为 止 ， 所 以 添加 数据 需要 的 运行 时 间 与 树 的 高 度 
成 正比 ， 也 是 O(logn) 。 





































































































\ 应 用 示例 





如 果 需 要 频繁 地 从 管理 的 数据 中 取出 最 小 值 ， 那 么 使 用 扒 来 操作 会 非常 方便 。 比 如 
4-5 节 中 提 到 的 狄 克 斯 特 拉 算 法 ， 每 一 步 都 需要 从 候补 项 点 中 选择 距离 起 点 最 近 的 那个 
项 点。 此 时 ， 在 顶点 的 选择 上 就 可 以 用 到 堆 。 
参考 : 4-5 狄 克 斯 特 拉 算 法 
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二 又 查找 树 ( 又 叫 作 二 又 搜索 树 或 二 又 排序 树 ) 是 一 种 数据 结构 ， 采 用 了 图 的 树 形 结构 
《关于 树 形 结构 的 详细 说 明 请 参考 4-2 节 )。 数 据 存储 于 二 又 查找 树 的 各 个 结 点 中 。 
参考 : 4-1 什么 是 图 
他 参考 : 4-2 广度 优先 搜索 


每 个 结 点 最 多 有 

两 个 耶 征 扩 @ 
这 就 是 二 叉 查 找 树 的 示 
例 。 结 点 中 的 数字 便 是 
存储 的 数据 。 此 处 以 不 
存在 相同 数字 为 前 提 进 
行 说 明 。 











二 叉 查 找 树 有 两 个 性 质 。 第 一 个 是 每 个 结 点 的 同样 ， 结 点 15 也 大 于 其 左 子 树 上 任意 
值 均 大 于 其 左 子 树 上 任意 一 个 结 点 的 值 。 比 如 点 的 值 。 
结 点 9 大 于 其 左 子 树 上 的 3 和 8。 


























滞 沪 只 | 1 


第 二 个 是 每 个 结 点 的 值 均 小 于 其 右 子 树 上 任意 ， ”根据 这 两 个 性 质 可 以 得 到 以 下 结论 。 首 先 ， 二 
一 个 结 点 的 值 。 比 如 结 点 15 小 于 其 右 子 树 上 的 ， ”又 查 找 树 的 最 小 结 点 要 从 顶端 开始 ， 符 
23、17 和 28。 ， ”的 末端 寻找 。 此 处 最 小 值 为 3。 





























反 过 来 ， 二 叉 查找 树 的 最 大 结 点 要 从 顶端 开 “， ”下 面 我 们 来 试 着 往 
始 ， 往 其 右 下 的 末端 寻找 。 此 处 最 大 值 为 28。 ' ”如 添加 数字 1。 





旨 排 人 专 15; 折 


以 将 其 往 左 移 首先 ， 从 二 叉 查找 树 的 


顶端 结 点 开始 寻找 添加 
数字 的 位 置 。 将 想 要 添 
加 的 1 与 该 结 点 中 的 值 
进行 比较 ， 小 于 它 则 往 
左 移 , 大 于 它 则 往 右 移 。 
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1 于 1 < 3， 所 以 继续 将 1 往 左 移 , 但 前 面 已 经 没 

















结 点 了 ， 所 以 把 1 作为 新 结 点 添加 到 左下 方 。 




















由 于 4 < 15, 所 
以 将 其 往 左 移 


和 前 面 的 步骤 一 样 ， 
首先 从 二 又 查找 树 
的 顶端 结 点 开始 寻 
找 添 加 数字 的 位 置 。 
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由 于 4 < 8, 所 以 需要 将 其 往 左 移 , 但 前 面 已 经 没 
结 点 了 ， 所 以 把 4 作为 新 结 点 添加 到 左下 方 。 









































接 下 来 看 看 如 何在 二 叉 查找 树 中 删除 结 点 。 比  ' ”如 果 需 要 删除 的 结 点 没有 子 结 点 ， 直 接 删 掉 该 
如 我 们 来 试 试 删除 结 点 28。 ， ” 结 点 即 可 。 
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如 果 需 要 删除 的 结 点 只 有 一 个 子 结 点 ， 那 么 先 
目标 结 点 














如 果 需 要 删除 的 结 点 有 两 个 子 结 点 ， 那 么 先 删 ”， 然后 在 被 删除 结 点 的 左 子 树 中 寻找 最 大 结 
掉 目 标 结 点 
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Ee 二 叉 查 找 树 性 质 的 前 提 下 删除 结 点 了 。 








最 后 将 最 大 结 点 移 到 被 删除 结 点 的 位 置 上 。 这 样 一 来 ， 就 能 在 满 吕 





如 果 需 要 移动 的 结 点 ( 此 处 为 4 ) 还 有 子 结 点 ， 就 递归 执行 前 面 的 操作 ( 关于 递归 ,请 参照 7-4 节 的 内 容 )。 


人 参考 : 7-4 汉 诺 塔 


由 二 |< |S 所 
以 将 其 往 左 移 。 











从 二 叉 查 找 树 的 项 端 结 点 开始 往 下 查找 。 和 添 
加 数据 时 一 样 ， 把 12 和 结 点 中 的 值 进行 比较 ， 
小 于 该 结 点 的 值 则 往 左 移 ， 大 于 则 往 右 移 。 











下 面 来 看 看 如 何在 二 叉 查 找 树 
如 我 们 来 试 试 查找 12。 



































删除 9 的 时 候 ， 我 们 将 “ 左 子 树 中 的 最 大 结 点 ”移动 到 了 删除 结 点 的 位 置 上 ， 但 是 根据 
二 叉 查 找 树 的 性 质 可 知 ， 移 动 “ 右 子 树 中 的 最 小 结 点 ”也 没有 问题 。 
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找到 结 点 12 了 。 








我 们 可 以 把 二 又 查找 树 当 作 是 二 分 查找 算法 思想 的 树 形 结构 体现 (二 分 查找 的 详细 
说 明 在 3-2 节 )。 因 为 它 具 有 前 面 提 到 的 那 两 个 性 质 ， 所 以 在 查找 数据 或 寻找 适合 添加 
数据 的 位 置 时 ， 只 要 将 其 和 现 有 的 数据 比较 大 小 ， 就 可 以 根据 比较 结果 得 知 该 往 哪 边 移 
动 了 。 

比较 的 次 数 取决 于 树 的 高 度 。 所 以 如 果 结 点 数 为 xn， 而 且 树 的 形状 又 较为 均衡 的 话 ， 
比较 大 小 和 移动 的 次 数 最 多 就 是 10g;n。 因 此 ， 时 间 复 杂 度 为 O(logn)。 但 是 ， 如 果树 的 
形状 朝 单 侧 纵向 延伸 ， 树 就 会 变 得 很 高 ， 此 时 时 间 复 杂 度 也 就 变 成 了 O(n)。 





































































































>” 补充 说 明 


有 很 多 以 二 叉 查找 树 为 基础 扩展 的 数据 结构 ， 比 如 “平衡 二 又 查找 树 "”。 这 种 数据 
结构 可 以 修正 形状 不 均衡 的 树 ， 让 其 始终 保持 均衡 形态 ， 以 提高 查找 效率 。 

另外 ， 虽 然 文中 介绍 的 二 叉 查 找 树 中 一 个 结 点 最 多 有 两 个 子 结 点 ， 但 我 们 可 以 把 子 
结 点 数 扩展 为 m ( m 为 预先 设 定好 的 常数 )。 像 这 种 子 结 点 数 可 以 自由 设 定 ， 并 且 形 状 均 
衡 的 树 便 是 B 树 。 





















































了 _] | 什么 是 排序 





1 将 数字 按 从 小 到 大 的 顺序 排列 


假设 下 面 这 张 表 是 初中 三 年 级 学 生 的 全 国 模拟 考试 成 绩 数据 。 


语文 理科 综合 


84 66 















































要 想 知 道 考生 的 各 科 排 名 和 综合 排名 ， 就 需要 按照 各 科 成 绩 和 总 成 绩 的 高 低 顺序 对 各 行 数 
据 进 行 排列 。 
再 比如 积攒 在 电子 邮箱 里 的 邮件 。 
发 件 人 到 主题 收 件 时 间 环 
武 小 / 关于 下 次 聚会 6/1/2017 10:05 














行程 确认 5/30/2017 18:01 
昨天 的 谢 礼 5/30/2017 9:39 











关于 订购 商品 5/29/2017 11:45 




















Re: 有 关 算 法 的 问题 5/25/2017 13:22 











合作 请 求 5/24/2017 12:57 


























新 酒 已 到 货 5/21/2017 16:10 























研讨 会 通知 5/20/2017 15:02 




















点 击 “ 收 件 时 间 ”， 邮 件 就 会 按照 收 件 时 间 的 星 晚 排列 ; 点 击 “ 发 件 人 ”， 邮 件 就 会 按照 发 
件 人 姓名 的 拼音 顺序 来 排列 。 这 是 因为 电子 邮箱 将 收 件 时 间 和 发 件 人 都 视 为 数字 ， 点 击 后 就 会 
将 它们 按 数字 从 小 到 大 的 顺序 排 好 。 

这 种 需要 将 数字 按照 大 小 排列 的 例子 还 有 很 多 。 在 这 种 场景 中 能 派 上 大 用 场 的 就 是 排序 
算法 了 。 
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和 所 谓 排序 


排序 就 是 将 输入 的 数字 按照 从 小 到 大 的 顺序 进行 排列 。 这 里 我 们 用 柱 形 来 表示 数字 ， 数 字 
越 大 ， 柱 形 就 越 高 。 


让 加 | 本 |， 


假设 现在 有 如 上 图 所 示 的 输入 数据 ,那么 我 们 的 目标 就 是 将 它们 像 下 图 一 样 ， 按 从 小 到 大 
的 顺序 从 左边 开始 依次 排列 。 














如 果 只 有 10 个 数字 ， 手 动 排序 也 能 轻松 完成 ,但 如 果 有 10 000 个 数据 ， 排 序 就 不 那么 容易 





了 。 这 时 ， 


使 月 


de 





1 各 种 各 样 的 排序 算法 


由 于 排序 是 一 个 比较 基础 的 问题 ， 所 以 排序 算法 的 种 类 也 比较 多 。 本 章 将 在 接 下 来 的 几 节 








中 对 各 种 排序 算法 进行 介绍 。 在 接 下 来 的 说 明 中 ， 输 入 的 数字 个 数 都 设 定 为 am。 为 了 便于 讲解 ， 





同一 个 例子 中 不 会 出 现 相同 的 数字 ， 但 实际 上 ， 即 使 有 相同 的 数字 ， 算 法 依然 可 以 正常 运行 。 
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冒 泡 排序 就 是 重复 “从 序列 右边 开始 比较 相 邻 两 个 数字 的 大 小 ， 再 根据 结果 交换 两 个 数字 
的 位 置 ”这 一 操作 的 算法 。 在 这 个 过 程 中 ， 数 字 会 像 泡 泡 一 样 ， 慢 慢 从 右 往 左 “ 浮 ”到 序列 的 
顶端 ， 所 以 这 个 算法 才 被 称 为 “ 冒 泡 排 序 ”。 














此 时 应 该 比较 7 和 6。 











在 序列 的 最 右边 放置 一 个 天 平 ， 比较 天 平 两 边 的 数字 。 如 果 右 边 的 数字 较 小 , 就 交换 这 两 个 数字 的 位 








|, pl, | |, pe 1, 


sy 


于 6 < 7， 所 以 交换 这 两 个 数字 。 完成 后 ， 天 平 往 左 移动 一 个 位 置 ， 比 较 两 个 数 
字 的 大 小 。 此 处 4 < 6， 所 以 无 须 交换 。 






































逢 状 沿 珈 


|, Ep |, 


于 8 > 4， 所 以 交换 这 两 个 数字 。 
















































































平 往 左 移动 一 个 位 置 并 比较 数字 。 重 复 同样 的 操 平 到 达 序 列 最 左边 为 止 。 





seoanne 


这 样 第 1 轮 操作 便 完成 了 。 


























平 最 终 到 达 了 最 左边 。 通 过 这 一 系列 操作 ， 序 列 中 最 小 的 数字 就 会 移动 到 最 











不 断 对 数字 进 


最 左边 的 数字 已 经 归 位 。 








1 ~so 





© 





-Neoanne 


ey 








将 天 平移 区 然后 重复 之 前 的 操作 ， 直 到 天 平 到 达 左 边 第 2 个 位 置 为 止 。 


NT 7/ 
,| 











TE 这 样 第 2 轮 操作 便 完 成 了 。 


平 到 达 左 边 第 2 个 位 置 时 ， 序 列 中 第 2 小 的 数字 也 就 到 达 了 指定 位 置 














TE 























E 复 同样 的 操作 直到 所 有 数字 都 归 位 为 止 。 
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由 于 9 > 6， 所 以 交换 这 两 个 数字 。 由 于 9 > 8, 所 以 交换 这 两 个 数字 。 


ee ,| 





排序 完成 。 


在 冒 泡 排 序 中 ， 第 1 轮 需要 比较 n-1 次 ,第 2 轮 需 要 比较 n-2 次 …… 第 n-1 轮 需 
要 比较 1 次 。 因 此 ， 总 的 比较 次 数 为 (n-1) + -2)+…+1s722。 这 个 比较 次 数 恒定 为 
该 数值 ， 和 输入 数据 的 排列 顺序 无 关 。 

不 过 ， 交 换 数 字 的 次 数 和 输入 数据 的 排列 顺序 有 关 。 假 设 出 现 某 种 极端 情况 ， 如 输 
入 数据 正好 以 从 小 到 大 的 顺序 排列 ， 那 么 便 不 需要 任何 交换 操作 ; 反 过 来 ， 输 入 数据 要 
是 以 从 大 到 小 的 顺序 排列 ， 那 么 每 次 比较 数字 后 便 都 要 进行 交换 。 因 此 ， 冒 泡 排 序 的 时 
间 复 杂 度 为 O (m2) 。 
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7 -二 | 选择 排序 


选择 排序 就 是 重复 “从 待 排序 的 数据 中 寻找 最 小 值 ， 将 其 与 序列 最 左边 的 数字 进行 交换 ” 
这 一 操作 的 算法 。 在 序列 中 寻找 最 小 值 时 使 用 的 是 线性 查找 。 
参考 : 3-1 线性 查找 


二 02 


四 oa 目 目 图 日 目 日 日 ,| ,| ,EL 


min 

















对 数字 1~9 进 行 排序 。 ' “使 用 线性 查找 在 数据 中 寻找 最 小 值 ， 于 是 我 们 找 
， ”到 了 最 小 值 1( 线性 查找 的 详细 说 明 在 3-1 节 )。 
他 参考: 3-1 线性 查找 


-BERNeeee 
ry 


这 样 第 1 轮 操作 便 完 成 了 。 















































将 最 小 值 1 与 序列 最 左边 的 6 进行 交换 ， 最 小 值 1 归 人 位。 不过， 如果 最 小 值 已 经 在 最 左 端 ， 就 不 需要 任 
何 操作 。 








,|| 


min 











在 余下 的 数据 中 继续 寻找 最 小 值 。 这 次 我 们 找 
1 了 最 小 值 2。 





eT , ,| |, 
t min 

















重复 同样 的 操作 直到 所 有 数字 都 归 位 为 止 。 

















这 样 第 2 轮 操 作 便 完成 了 。 


品目 图 图 四 目 目 目 
‘+ 


将 数字 2 与 左边 第 2 个 数字 6 进行 交换 , 最 小 值 
2 归 位 。 


,| 


排序 完成 。 








选择 排序 使 用 了 线性 查找 来 寻找 最 小 值 ， 因 此 在 第 1 轮 中 需要 比较 4-1 个 数字 ， 第 


2 轮 需 要 比较 -2 个 数字 





到 第 n-1 轮 的 时 候 就 只 需 比较 1 个 数字 了 。 因 此 ， 总 的 比 


较 次 数 与 冒 泡 排序 的 相同 ， 都 是 2-1) + (n 一 2) +…+1=72/2 次 。 





每 轮 中 交换 数字 的 次 数 最 多 为 1 次 。 如 果 输 入 数据 就 是 按 从 小 到 大 的 顺序 排列 的 ， 





便 不 需要 进行 任何 交换 。 选 择 排序 的 时 间 复 杂 度 也 和 置 泡 排序 的 一 样 ， 都 为 O(n?) 。 





-4 | 插入 排序 


插入 排序 是 一 种 从 序列 左 端 开始 依次 对 数据 进行 排序 的 算法 。 在 排序 过 程 中 ， 左 侧 的 数据 








陆续 归 位 ， 而 右 侧 留 下 的 就 是 还 未 被 排序 的 数据 。 插 入 排序 的 思路 就 是 从 右 侧 的 未 排序 区 域内 








取出 一 个 数据 ， 然 后 将 它 搬 入 到 已 排序 区 域内 合适 的 位 置 上 。 


TE 





此 处 同 档 











对 数字 1~9 进 





A ] 


行 排序 。 


第 1 轮 操 作 就 这 样 完成 了 ， 十 
分 简单 。 


日 B 目 品目 目 目 。 





























首先 ， 我 们 假设 最 左边 的 数字 5 已 经 完成 排序 ， 所 以 此 时 只 有 5 是 已 归 位 的 数字 。 

















Bol 


接 下 来 , 从 待 排 数字 ( 未 排序 区 域 ) 9 


边 的 数字 更 大 ， 就 交换 这 两 个 数字 。 重 复 该 操作 ， 直 到 左边 已 归 位 的 数字 比 取 出 的 数字 更 小 ， 或 者 取 
上 的 数字 已 经 被 移 到 整个 序列 的 最 左边 为 止 。 





FP 取出 最 左边 的 数字 3，, 将 它 与 左边 




















已 归 位 的 数字 进行 比较 。 若 左 
























































数字 已 经 被 移 到 整个 序列 的 
最 左边 ， 操 作 结 束 。 























F5 > 3， 所 以 交换 这 两 个 数字 。 


|, 


这 样 第 2 轮 操作 也 完成 了 。 








对 数字 3 的 操作 到 此 结束 。 此 时 3 和 5 已 归 位 ， 还 剩 下 右边 7 个 数字 尚未 排序 。 





1 wwe 
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5 目 Hola 


接 下 来 是 第 3 轮 。 和 前 面 一 样 ， 取 出 未 排序 





















区 域 








Pp 最 左边 的 数字 4， 将 它 与 左边 的 数字 5 进行 比较 。 








日 


由 于 5 > 4， 所 以 交换 这 两 个 数字 。 交 换 后 再 把 4 和 左边 的 3 进行 比较 ,发现 3 < 4， 因 为 出 现 了 比 自己 
\ 的 数字 ， 所 以 操作 结束 。 






















































日 日 目 目 日 图 四 图。 oag oggl, 
/ 


于 是 4 也 归 位 了 。 此 时 3、4、5 都 已 归 位 ,已 遇 到 左边 的 数字 都 比 自己 小 的 情况 时 …… 
排序 区 域 也 得 到 了 扩大 。 


























吗 
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第 未 轮 结 4 


插 
入 
排 
序 


不 需要 任何 操作 即 可 完成 排序 。 
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日 一 
电 


重复 上 述 操作 ， 数字 都 归 位 。 ， “对 所 有 数字 的 操作 都 结束 时 ， 排 序 也 就 完成 了 。 






































在 插入 排序 中 ， 需 要 将 取出 的 数据 与 其 左边 的 数字 进行 比较 。 就 跟前 面 讲 的 步骤 一 
样 ， 如 果 左 边 的 数字 更 小 ， 就 不 需要 继续 比较 ， 本 轮 操作 到 此 结束 ， 自 然 也 不 需要 交换 
数字 的 位 置 。 

然而 ， 如 果 取 出 的 数字 比 左边 已 归 位 的 数字 都 要 小 ， 就 必须 不 停 地 比较 大 小 ， 交 换 
数字 ， 直 到 它 到 达 整 个 序列 的 最 左边 为 止 。 具 体 来 说 ， 就 是 第 上 轮 需要 比较 上 -1 次 。 基 
此 ， 在 最 糟糕 的 情况 下 ， 第 2 轮 需 要 操作 1 次 ， 第 3 轮 操作 2 次 …… 第 半 轮 操作 -1 
次 ， 所 以 时 间 复 杂 度 和 冒 泡 排序 的 一 样 ， 都 为 O(n?) 。 

和 前 面 讲 的 排序 算法 一 样 ， 输 入 数据 按 从 大 到 小 的 顺序 排列 时 就 是 最 糟糕 的 情况 。 
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27_5 | 堆 排序 


堆 排 序 的 特点 是 利用 了 数据 结构 中 的 堆 。 关 于 堆 的 详细 说 明 在 1-7 节 。 
参考 : 1-7 堆 























现在 ， 所 有 数据 都 存 进 堆 里 了 。 为 了 排序 ， 需 要 再 从 堆 中 把 数据 一 个 个 取出 来 。 





取出 数据 时 会 从 最 大 的 数据 开始 取 ， 所 以 将 取出 的 数据 反 序 输出 ， 排 

















从 降序 排列 的 堆 
序 就 完成 了 。 


把 取出 的 数字 放 在 数组 的 
最 右边 。 


我 们 来 试 一 试 吧 。 首 先 取 出 根 结 点 的 数字 7。 





同样 地 ， 取 出 根 结 点 的 数字 6， 将 它 放 在 右 数 


重新 构造 堆 。 重 构 的 规则 请 参考 1-7 节 的 内 容 。 
第 2 个 位 置 上 。 


CC 参考 : 1-7 堆 











cls; 





新 构造 堆 。 ， ”重复 上 述 操作 直到 堆 变 空 为 止 。 


ellsll; 
[By 


» 
+ 
* 





从 堆 中 取出 了 所 有 数字 ， 排 序 完成 。 
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5 
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排序 一 开始 需要 将 n 个 数据 存 进 堆 里 ， 所 需 时 间 为 O(nlogn)。 排 序 过 程 中 ， 堆 从 
空 堆 的 状态 开始 ， 逐 渐 被 数据 填 满 。 由 于 堆 的 高 度 小 于 logyn， 所 以 插入 1 个 数据 所 需要 






































的 时 间 为 O(logn)。 
每 轮 取出 最 大 的 数据 并 重 构 堆 所 需要 的 时 间 为 O(logn)。 由 于 总 共有 n 轮 ， 所 以 重 

构 后 排序 的 时 间 也 是 O (nlogn) 。 因 此 ， 整 体 来 看 堆 排 序 的 时 间 复 杂 度 为 O (nlogn) 。 

这 样 来 看 ， 堆 排序 的 运行 时 间 比 之 前 讲 到 的 冒 泡 排序 、 选 择 排序 、 揪 入 排序 的 时 间 

O02) 都 要 短 ， 但 由 于 要 使 用 堆 这 个 相对 复杂 的 数据 结构 ， 所 以 实现 起 来 也 较为 困难 。 

































































> 补充 说 明 


一 般 来 说 ， 需 要 排序 的 数据 都 存储 在 数组 中 。 这 次 我 们 使 用 了 堆 这 种 数据 结构 ， 但 
实际 上 ， 这 也 相当 于 将 堆 媒 入 到 包含 了 序列 的 数组 中 ， 然 后 在 数组 中 通过 交换 数据 来 进 
行 排序 。 具 体 来 说 ， 就 是 让 堆 中 的 各 结 点 和 数组 像 下 图 这 样 星 对 应 关系 。 正 如 大 家 所 见 ， 
这 可 以 说 是 强行 在 数组 中 使 用 了 堆 结构 。 


gasppee 
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7_6 | 归并 排序 


归并 排序 算法 会 把 序列 分 成 长 度 相 同 的 两 个 子 序列 ， 当 无 法 继续 往 下 分 时 〈 也 就 是 每 个 子 
序列 中 只 有 一 个 数据 时 )， 就 对 子 序列 进行 归并 。 归 并 指 的 是 把 两 个 排 好 序 的 子 序列 合并 成 一 个 
有 序 序列 。 该 操作 会 一 直 重 复 执 行 ， 直 到 所 有 子 序 列 都 归并 为 一 个 整体 为 止 。 


日 日 日 目 目 o 昌 


首先 ， 要 把 序列 对 半分 割 。 





先 分 成 两 段 





合并 时 需要 将 数字 按 从 
小 到 大 的 顺序 排列 。 


分 割 完 毕 。 接 下 来 对 分 割 后 的 元 素 进行 合并 。 


此 时 要 比较 

两 个 子 序列 下 面 ,我们 来 看 看 怎么 合并 

的 首位 数字 [4, 6] 和 [3, 7]。 合 并 这 种 含 

4 和 3。 有 多 个 数字 的 子 序列 时 ， 要 
先 比较 首位 数字 ， 再 移动 较 
小 的 数字 。 








最 后 移动 剩 下 的 7。 递归 执行 上 面 的 操作 ， 直 到 所 有 的 数字 都 合 为 
一 个 整体 为 止 。 























bse te 


这 里 也 要 比较 两 个 子 序列 中 的 
首位 数字 。 





se 


合并 完成 ， 序 列 的 排序 也 就 完成 了 。 


归并 排序 中 ， 分 割 序列 所 花费 的 时 间 不 算 在 运行 时 间 内 (可 以 当 作 序 列 本 来 就 是 分 
割 好 的 )。 在 合并 两 个 已 排 好 序 的 子 序列 时 ， 只 需 重 复 比 较 首位 数据 的 大 小 ， 然 后 移动 较 
小 的 数据 ， 因 此 只 需 花费 和 两 个 子 序列 的 长 度 相 应 的 运行 时 间 。 也 就 是 说 ， 完 成 一 行 归 
并 所 需 的 运行 时 间 取 决 于 这 一 行 的 数据 量 。 

看 一 下 上 面 的 图 便 能 得 知 ， 无 论 哪 一 行 都 是 n 个 数据 ， 所 以 每 行 的 运行 时 间 都 为 O(n) 。 
而 将 长 度 为 的 序列 对 半分 割 直到 只 有 一 个 数据 为 止 时 ， 可 以 分 成 logyn 行 ， 因此， 总 
共有 logyn 行 。 也 就 是 说 ， 总 的 运行 时 间 为 O(nlogn) ， 这 与 前 面 讲 到 的 堆 排序 相同 。 
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-了 | 快速 排序 


快速 排序 算法 首先 会 在 序列 中 随机 选择 一 个 基准 值 (pivot )， 然 后 将 除了 基准 值 以 外 的 数 分 
为 “ 比 基 准 值 小 的 数 ” 和 “ 比 基 准 值 大 的 数 ” 这 两 个 类 别 ， 再 将 其 排列 成 以 下 形式 。 
[ 比 基 准 值 小 的 数 ] 基准 值 [ 比 基 准 值 大 的 数 ] 


接着 ， 对 两 个 “[ ]” 中 的 数据 进行 排序 之 后 ， 整 体 的 排序 便 完成 了 。 对 “[ ] ”里面 的 数据 
进行 排序 时 同样 也 会 使 用 快速 排序 。 
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下 面 我 们 就 来 看 看 快速 排序 的 步骤 。 
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在 序列 中 随机 选择 一 个 基准 值 。 这 里 选择 了 4。 
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四 
pivot 


将 其 他 数字 和 基准 值 进行 比较 。 小 于 基准 值 的 往 左 移 ， 大 于 基准 值 的 往 右 移 。 
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pivot | pivot 
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首先 ， 比 较 3 和 基准 值 4。 ， ”因为 3 < 4， 所 以 将 3 往 左 移 。 


ool 目 Nool 加 
目 目 日 


pivot ' pivot 
目 本 四 


接 下 来 ， 比 较 5 和 基准 值 4。 ， ”因为 5 > 4， 所 以 将 5 往 右 移 。 
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Bog BNeg 


比 基 准 值 小 比 基 准 
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pivot ' pivotL __ 











把 基准 值 4 插入 序列 。 这 样 , 4 左边 就 是 比 它 小 ， ”分 别 对 左边 和 右边 的 数据 进行 排序 后 ， 就 能 
的 数字 ， 右 边 就 是 比 它 大 的 数字 。 ， ”成 整体 的 排序 。 
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两 边 的 排序 操作 也 和 前 面 的 一 样 。 首 先 来 看 看 ， 随机 选择 一 个 基准 值 。 这 次 选择 6。 
如 何 对 右边 的 数据 进行 排序 吧 。 ' 
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四 四 图 目 由 
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把 其 余数 据 分 别 和 基准 值 6 进行 比较 ， 小 于 基 完成 了 大 小 比较 和 位 置 移动 。 
准 值 的 就 往 左 移 ， 大 于 的 就 往 右 移 。 
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和 面 一 样 ， 对 左右 两 边 分 别 进行 排序 ， 进 而 完成 整体 排序 。 但 是 此 时 左边 只 有 5,， 所 以 已 经 是 排序 完 
状态， 不 需要 任何 操作 。 而 右边 就 和 前 面 一 样 ， 先 选 上 
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选择 8 作为 基准 值 。 ，， 将 9 和 7 分 别 与 基准 值 8 进行 比较 后 ， 两 个 数字 
的 位 置 便 分 好 了 。8 的 两 边 都 只 有 一 个 数据 ， 医 
此 不 需要 任何 操作 。 这 样 7、8、9 便 完成 排序 了 。 
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回 到 上 一 行 ， 由 于 7、8、9 完 成 了 排序 ， 所 以 ”' ”于 是 ， 最初 选择 的 基准 值 4 的 右边 排序 完毕 。 
5、6、7、8、9 也 完成 了 排序 。 ' 
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加 日 目 sb; 


左边 也 以 相同 的 操作 进行 排序 ， 整 体 的 排序 工作 也 就 完成 了 。 


> 补充 说 明 


快速 排序 是 一 种 “分 治 法 ”。 它 将 原本 的 问题 分 成 两 个 子 问 题 ( 比 基 准 值 小 的 数 和 
比 基 准 值 大 的 数 )， 然 后 再 分 别 解决 这 两 个 问题 。 子 问题 ， 也 就 是 子 序列 完成 排序 后 ， 再 
像 一 开始 说 明 的 那样 ， 把 他 们 合并 成 一 个 序列 ， 那 么 对 原始 序列 的 排序 也 就 完成 了 。 

不 过 ， 解 决 子 问题 的 时 候 会 再 次 使 用 快速 排序 ， 甚 至 在 这 个 快速 排序 里 仍然 要 使 用 
快速 排序 。 只 有 在 子 问 题 里 只 剩 一 个 数字 的 时 候 ， 排 序 才 算 完 成 。 

像 这 样 ， 在 算法 内 部 继续 使 用 该 算法 的 现象 被 称 为 “递归 ”。 关 于 递归 的 详细 说 明 
在 7-4 节 。 实 际 上 前 一 节 中 讲 到 的 归并 排序 也 可 看 作 是 一 种 递归 的 分 治 法 。 
参考 : 7-4 汉 诺 塔 











分 割 子 序列 时 需要 选择 基准 值 ， 如 果 每 次 选择 的 基准 值 都 能 使 得 两 个 子 序列 的 长 度 
为 原本 的 一 半 ， 那 么 快速 排序 的 运行 时 间 和 归并 排序 的 一 样 ， 都 为 O(nlogn)。 和 归并 排 
序 类 似 ， 将 序列 对 半分 割 logyn 次 之 后 ， 子 序列 里 便 只 剩 下 一 个 数据 ， 这 时 子 序列 的 排 
序 也 就 完成 了 。 因 此 ， 如 果 像 下 图 这 样 一 行 行 地 展现 根据 基准 值 分 割 序列 的 过 程 ， 那 么 1 
总 共 会 有 logzn 行 。 
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每 行 中 每 个 数字 都 需要 和 基准 值 比 较 大 小 ， 因 此 每 行 所 需 的 运行 时 间 为 O(n)。 由 此 


可 知 ， 整 体 的 时 间 复 杂 度 为 O(nlogn) 。 

如 果 运 气 不 好 ， 每 次 都 选择 最 小 值 作为 基准 值 ， 那 么 每 次 都 需要 把 其 他 数据 移 到 基 
准 值 的 右边 ， 弟 归 执 行 n 行 ， 运 行 时 间 也 就 成 了 O 02) 。 这 就 相当 于 每 次 都 选 出 最 小 值 
并 把 它 移 到 了 最 左边 ， 这 个 操作 也 就 和 选择 排序 一 样 了 。 此 外 ， 如 果 数 据 中 的 每 个 数字 
被 选 为 基准 值 的 概率 都 相等 ， 那 么 需要 的 平均 运行 时 间 为 O (nlogn) 。 












































数组 的 查找 
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线性 查找 是 一 种 在 数组 中 查找 数据 的 算法 (关于 数组 的 详细 讲解 在 1-3 节 )。 与 将 在 3-2 节 
中 讲解 的 二 分 查找 不 同 ， 即 便 数据 没有 按 顺序 存储 ， 也 可 以 应 用 线性 查找 。 线 性 查找 的 操作 很 
简单 ， 只 要 在 数组 中 从 头 开始 依次 往 下 查找 即 可 。 虽 然 存 储 的 数据 类 型 没有 限制 ， 但 为 了 便于 
理解 ， 这 里 我 们 假设 存储 的 是 整数 。 
参考 : 1-3 数组 
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来 试 试 查找 数字 6 吧 。 
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首先 ， 检 查 数组 中 最 左边 的 数字 ， 将 其 与 6 进行 比较 。 如 果 结 果 一 致 ， 查 找 便 结 束 ， 不 一 致 则 向 右 检 
查 下 一 个 数字 。 
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昌国 图 ga 四 四 四 四 olaooageg 和 
\y v 和 
此 处 不 一 致 ， 所 以 向 右 检 查 下 一 个 数字 。 ， ”重复 上 面 的 操作 直到 找到 数字 6 为 止 。 
AN 1 V4 
eooagee 
\/ 
找到 6 了， 查找 结束 。 
解说 
线性 查找 需要 从 头 开始 不 断 地 按 顺 序 检查 数据 ， 因 此 在 数据 量 大 且 目 标 数据 靠 后 ， 
或 者 目标 数据 不 存在 时 ， 比 较 的 次 数 就 会 更 多 ， 也 更 为 耗 时 。 若 数据 量 为 nx， 线性 查找 
的 时 间 复 杂 度 便 为 O(n)。 
O 
学 
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尘 叭 号 隙 湾 


二 分 查找 也 是 一 种 在 数组 中 查找 数据 的 算法 。 和 3-1 节 讲 到 的 线性 查找 不 同 ， 它 只 能 查找 
已 经 排 好 序 的 数据 。 二 分 查找 通过 比较 数组 中 间 的 数据 与 目标 数据 的 大 小 ， 可 以 得 知 目标 数据 
是 在 数组 的 左边 还 是 右边 。 因 此 ， 比 较 一 次 就 可 以 把 查找 范围 缩小 一 半 。 重 复 执行 该 操作 就 可 
以 找到 目标 数据 ， 或 得 出 目标 数据 不 存在 的 结论 。 





@ : OZ 


吕 晶 日 四 四 四 目 图 图 吕 吕 可 四 四 目 四 国 


还 是 来 试 试 查找 数字 6 吧 。 ， ”首先 找到 数组 中 间 的 数字 ， 此 处 为 5。 


根据 5 < 6， 可 以 得 知 6 在 5 
的 右边 。 
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将 5 和 要 查找 的 数字 6 进行 比较 。 
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把 不 需要 的 数字 移出 查找 范围 。 














根据 6 < 7， 可 以 得 
知 6 在 7 的 左边 。 
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比较 7 和 6。 
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在 剩 下 的 数组 中 找到 中 间 的 数字 ， 此 处 为 6。 
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在 剩 下 的 数组 中 找到 中 间 的 数字 ， 此 处 为 7。 





i |, |, 
BDA 


把 不 需要 的 数字 移出 查找 范围 。 
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6=6， 成 功 找到 目标 数字 。 
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二 分 查找 利用 已 排 好 序 的 数组 ， 每 一 次 查找 都 可 以 将 查找 范围 减 半 。 查 找 范围 内 只 
剩 一 个 数据 时 查找 结束 。 

数据 量 为 n 的 数组 ， 将 其 长 度 减 半 logn 次 后 ， 其 中 便 只 剩 一 个 数据 了 。 也 就 是 说 ， 
在 二 分 查找 中 重复 执行 “将 目标 数据 和 数组 中 间 的 数据 进行 比较 后 将 查找 范围 减 半 ” 的 
操作 logn 次 后 ， 就 能 找到 目标 数据 〈 若 没 找 到 则 可 以 得 出 数据 不 存在 的 结论 )， 因 此 它 
的 时 间 复 杂 度 为 O(logn) 。 
































> 补充 说 明 


二 分 查找 的 时 间 复 杂 度 为 O(logn)， 与 线性 查找 的 O(n) 相 比 速度 上 得 到 了 指数 倍 提 
高 (x=logzn, MI n=2*)o 
但 是 ， 二 分 查找 必须 建立 在 数据 已 经 排 好 序 的 基础 上 才能 使 用 ， 因 此 添加 数据 时 必 
须 加 到 合适 的 位 置 ， 这 就 需要 额外 耗费 维护 数组 的 时 间 。 
而 使 用 线性 查找 时 ， 数 组 中 的 数据 可 以 是 无 序 的 ， 因 此 添加 数据 时 也 无 须 顾虑 位 
， 直 接 把 它 加 在 未 尾 即 可 ， 不 需要 耗费 时 间 。 
综 上 ， 具 体 使 用 哪 种 查找 方法 ， 可 以 根据 查找 和 添加 两 个 操作 哪个 更 为 频繁 来 决定 。 
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图 
的 -=r a 5 
和 1 离散 数学 中 的 图 


说 到 “图 *”， 可 能 大 部 分 人 想到 的 是 饼 状 图 、 柱 状 图 ,或 者 数学 中 y=flx) 所 呈现 的 图 ， 而 
计算 机 科学 或 离散 数学 中 说 的 “图 ” 却 是 下 面 这 样 的 。 


上 图 中 的 圆圈 叫 作 “ 顶 点 ”( 也 叫 “ 绪 点 ”)， 连 接 顶 点 的 线 叫 作 “ 边 ”。 也 就 是 说 ， 由 顶点 
和 连接 每 对 顶点 的 边 所 构成 的 图 形 就 是 图 。 





1 图 可 以 表现 各 种 关系 


图 可 以 表现 社会 中 的 各 种 关系 ， 使 用 起 来 非常 
方便 。 假 设 我 们 要 开 一 个 派对 ， 将 参加 人 员 作 为 顶 
点 ， 把 互相 认识 的 人 用 边 连 接 ， 就 能 用 图 来 表现 参 
加 人 员 之 间 的 人 际 关系 了 。 

再 举 个 例子 ， 若 将 车 站 作为 顶点 ， 将 相 邻 两 站 
用 边 连 接 ， 就 能 用 图 来 表现 地 铁 的 路 线 了 。 


lo~o 





另外 ， 还 可 以 在 计算 机 网 络 中 把 路 由 器 作为 顶点 ， 将 相互 连接 的 两 个 路 由 器 用 边 连接 ，j 


样 就 能 用 图 来 表现 网 络 的 连接 关系 了 。 


1 加 权 图 


上 面 讲 到 的 都 是 由 顶点 和 边 构 成 的 图 ， 而 我 
们 还 可 以 给 边 加 上 一 个 值 。 

这 个 值 叫 作 边 的 “权重 ”或 者 “ 权 ”， 加 了 权 
的 图 被 称 为 “加 权 图 ”"。 没 有 权 的 边 只 能 表示 两 个 
顶点 的 连接 状态 ， 而 有 权 的 边 就 可 以 表示 顶点 之 
间 的 “连接 程度 ”。 
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这 个 “程度 ”是 什么 意思 呢 ? 根据 图 的 内 容 不 同 ,“ 程 度 ” 表 示 的 意思 也 不 同 。 比 如 在 计算 
机 网 络 中 ， 给 两 台 路 由 器 之 间 的 边 加 上 传输 数据 所 需要 的 时 间 ， 这 张 图 就 能 表示 网 络 之 间 的 通 
信 时 间 了 。 

而 在 路 线 图 中 ， 如 果 把 地 铁 在 两 个 车 站 间 行 驶 的 时 间 加 在 边 上 ， 这 张 图 就 能 表现 整个 路 线 
的 移动 时 间 ; 如 果 把 两 个 车 站 间 的 票 价 加 在 边 上 ， 就 能 表现 乘 车 费 了 。 虽 然 在 一 些 情况 下 顶点 
也 可 以 有 权重 ， 但 本 书 中 并 不 涉及 这 类 情况 ， 故 此 处 忽略 。 





1 有 向 图 


当 我 们 想 在 路 线 图 中 表示 该 路 线 只 能 单 向 


行驶 时 ， 就 可 以 给 边 加 上 箭头 ， 而 这 样 的 图 就 叫 
作 “ 有 向 图 "。 比 如 网 页 里 的 链接 也 是 有 方向 性 
的 ， 用 有 向 图 来 表示 就 会 很 方便 。 
与 此 相对 ， 边 上 没有 第 头 的 图 便 是 “无 向 图 ”。 
右 图 中 我 们 可 以 从 顶点 A 到 顶点 B, 但 不 
———®@ 


能 直接 从 B 到 A， 而 B 和 C 之 间 有 两 条 边 分 别 
指向 两 个 方向 ， 因 此 可 以 双向 移动 。 
和 无 向 图 一 样 ， 有 向 图 的 边 也 可 以 加 上 权重 。 
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3 
7 5 2 
2 


在 上 图 中 ， 从 顶点 B 到 顶点 C 的 权重 为 5， 而 从 C 到 B 的 权重 为 7。 如 果 做 的 是 一 个 表示 
移动 时 间 的 图 ， 而 从 B 到 C 是 下 坡 路 ， 就 有 可 能 出 现 这 样 的 情况 。 就 像 这 样 ， 使 用 有 向 图 还 可 
以 设置 非 对 称 的 权重 。 





1 图 能 给 我 们 带 来 哪些 便利 


想 一 想 图 能 给 我 们 带 来 的 好 处 吧 。 假 设 图 中 有 两 个 顶点 s 和 +t， 而 我 们 设计 出 了 一 种 算法 ， 
可 以 找到 “从 s 到 1 的 权重 之 和 最 小 ”的 那 条 路 径 。 

那么 ， 这 种 算法 就 可 以 应 用 到 这 些 问题 上 : 寻找 计算 机 网 络 中 通信 时 间 最 短 的 路 径 ， 寻 找 
路 线 图 中 耗 时 最 短 的 路 径 ， 寻 找 路 线 图 中 最 省 乘 车 费 的 路 径 等 “。 

就 像 这 样 ， 只 要 能 用 图 来 表示 这 些 关系 ， 我 们 就 可 以 用 解决 图 问题 的 算法 来 解决 这 些 看 似 
不 一 样 的 问题 。 





四 本章 的 知识 点 


本 章 将 要 学 习 的 是 图 的 搜索 算法 ， 和 可 以 解决 图 的 基本 问题 一 一 最 短路 径 问 题 的 算法 。 

图 的 搜索 指 的 就 是 从 图 的 某 一 顶点 开始 ， 通 过 边 到 达 不 同 的 项 点， 最 终 找到 目标 顶点 的 过 
程 。 根 据 搜索 的 顺序 不 同 ， 图 的 搜索 算法 可 分 为 “广度 优先 搜索 ”和 “深度 优先 搜索 ”这 两 种 。 

最 短路 径 问题 和 前 文 提 到 的 一 样 ， 就 是 要 在 从 s 到 上 的 路 径 中 ， 找 到 一 条 所 经 过 的 边 的 权重 
总 和 最 小 的 路 径 。 





实 中 的 情况 会 稍 有 不 同 ， 因 为 换 乘 地 铁 也 需要 一 定 的 时 间 ， 而 且 乘 车 费 也 不 是 按 各 站 之 间 票 价 的 总 和 来 计 
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鸭 闸 信守 
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4 -2 | 广度 优先 搜索 





图 
广度 优先 搜索 是 一 种 对 图 进行 搜索 的 算法 。 假 设 我 们 一 开始 位 于 某 个 顶点 ( 即 起 点 ) 此 
索 时 并 不 知道 图 的 整体 结构 ， 而 我 们 的 目的 是 从 起 点 开始 顺 着 边 搜索 ， 直 到 到 达 指 定 顶 点 〈 即 终 


点 ) 在 此 过 程 中 每 走 到 一 个 顶点 ， 就 会 判断 一 次 它 是 否 为 终点 。 广 度 优先 搜索 会 优先 从 离 起 点 
近 的 顶点 开始 搜索 。 


用 红色 表示 此 时 所 在 的 项 点 。 











刀 点 A 上 ， 此 时 并 不 知道 G 在 哪里 

















用 绿色 表示 候补 项 点 。 








将 可 以 从 A 直 达 的 
三 个 顶点 B、C、D 
设 为 下 一 步 的 候补 
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从 候补 顶点 中 选 出 一 个 顶点 。 优 先 选 择 最 早 成 。 ， 此 处 B、C、D 同时 成 为 候补 ， 所 以 我 们 随机 先 
为 候补 的 那个 项 点， 如 果 多 个 顶点 同时 成 为 修 。 ， ” 择 了 最 左边 的 顶点 B。 








补 ， 那 么 可 以 随意 选择 其 中 一 个 。 


此 处 , 候补 项 点 是 用 “先入 先 出 ”( FIFO ) 的 方式 来 管理 的 , 因此 可 以 使 | 
数据 结构 。 
CO 参考 : 1-5 队列 











内 书生 扫 末 560 
改 用 橙色 表示 。 


移动 到 选 ] 


P 的 顶点 B 





上 。 此 时 我 们 在 B 上 ， 
所 以 B 变 为 红色 ， 同 时 








Co 





盾 已 经 搜索 过 的 顶点 变 
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“队列 ”这 个 





测 洲 直下 证 
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图 


流 浅 否 


1 和 oo 





























重复 上 述 操 作 直 到 到 达 终 点 ， 或 者 所 有 的 顶点 
都 被 遍历 为 止 。 


此 时 ， 最 早 成 为 候补 项 点 的 是 C 和 D， 我 们 选 
择 了 左边 的 顶点 Co 


这 个 示例 中 的 搜索 顺序 为 A、B、C、D、E、F、 
H、 1|、 J、K。 








记 一 个 





测 洲 直下 证 























广度 优先 搜索 的 特征 为 从 起 点 开始 ， 由 近 及 远 进行 广泛 的 搜索 。 目标 项 点 离 
起 点 越 近 ， 搜 索 结束 得 就 越 快 。 


> 补充 说 明 





为 了 方便 说 明 ， 这 次 讲解 用 的 是 没有 闭环 "的 图 。 不 过 ， 如 果 图 中 有 闭环 ， 其 搜索 
步骤 也 是 一 样 的 。 像 示例 那样 的 没有 闭环 的 图 叫 作 “ 树 ”。 











中 闭环 如 下 图 所 示 ， 起 点 和 终点 是 同一 个 顶点 。 


1 woo 





深度 优先 搜索 和 广度 优先 搜索 一 样 ， 都 是 对 图 进行 搜索 的 算法 ， 目 的 也 都 是 从 起 点 开始 搜 
索 直 到 到 达 指 定 顶 点 (终点 ) 深度 优先 搜索 会 沿 着 一 条 路 径 不 断 往 下 搜索 直到 不 能 再 继续 为 
止 ， 然 后 再 折返 ， 开 始 搜索 下 一 条 候补 路 径 。 


用 红色 表示 此 时 所 在 的 顶点 。 








A 为 起 点 ，G 为 终点 。 一 
开始 我 们 在 起 点 A 上 。 





用 绿色 表示 候补 项 点 。 











将 可 以 从 A 直 达 的 三 个 
顶点 B、C、D 设 为 下 一 
步 的 候补 顶点 。 

















此 处 B、C、D 同 时 成 为 候补 ， 所 以 我 们 随机 选 
择 了 最 左边 的 顶点 。 


从 候补 项 点 中 选 吕 
顶点 。 优先 选择 最 新 成 为 
候补 的 点 ,如果 几 个 顶点 
同时 成 为 候补 ,那么 可 以 
随意 选择 一 个 。 








A 已 经 搜索 完 
毕 ， 改 用 橙色 
表示 。 





移动 到 选中 的 顶点 B。 此 时 我 们 在 B 上 ， 所 以 B 
变 为 红色 ， 同 时 将 已 经 搜索 过 的 顶点 变 为 查 色 。 


























此 处 ， 候 补 项 点 是 用 “后 入 先 则 
数据 结构 。 
他 参考 : 1-4 材 


和 ”( LIFO ) 的 方式 来 管理 的 ， 因 此 可 以 使 




















图 















































的 

搜 

这 

重复 上 述 操作 直到 到 达 终点 这 个 示例 的 搜索 顺序 为 A、B、E、K、F、 
E 被 遍历 为 止 。 ' c、H。 
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洲 洲 直下 间 消 


到 达 终 点 G， 搜 索 结束 。 








深度 优先 搜索 的 特征 为 沿 着 一 条 路 径 不 断 往 下 ， 进 行 深度 搜索 。 虽 然 广度 优先 搜索 
和 深度 优先 搜索 在 搜索 顺序 上 有 很 大 的 差异 ， 但 是 在 操作 步骤 上 却 只 有 一 点 不 同 ， 那 就 
是 选择 哪 一 个 候补 项 点 作为 下 一 个 项 点 的 基准 不 同 。 

广度 优先 搜索 选择 的 是 最 早 成 为 候补 的 顶点， 因为 项 点 离 起 点 越 近 就 越 早 成 为 候 
补 ， 所 以 会 从 离 起 点 近 的 地 方 开 始 按 顺 序 搜索 ， 而 深度 优先 搜索 选择 的 则 是 最 新 成 为 候 
补 的 顶点 ， 所 以 会 一 路 往 下 ， 沿 着 新 发 现 的 路 径 不 断 深入 搜索 。 
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No. 


外 -A | 贝尔 曼 - 福特 算法 








的 贝尔 曼 - 福特 (Bellman-Ford ) 算法 是 一 种 在 图 中 求解 最 短路 径 问 题 的 算法 。 最 短路 径 问 
、 题 就 是 在 加 权 图 指定 了 起 点 和 终点 的 前 提 下 ， 寻 找 从 起 点 到 终点 的 路 径 中 权重 总 和 最 小 的 那 条 


路 径 。 





这 里 我 们 设 A 为 起 点 、 
G 为 终点 ， 来 讲解 贝尔 
曼 - 福 特 算法 。 


最 初 并 不 知道 要 走 
多 远 才 能 到 达 其 他 
项 点 ( 甚至 不 知道 能 
否 到 达 )， 因 此 将 起 
点 以 外 的 项 点 权重 
设 为 无 穷 大 。 








首先 设置 各 个 顶点 的 初始 权重 : 起 点 为 0， 其 他 顶点 为 无 穷 大 ( = )。 这 个 权重 表示 的 是 从 A 到 该 项 点 
的 最 短路 径 的 暂 定 距离 。 随 着 计算 往 下 进行 ， 这 个 值 会 变 得 越 来 越 小 ， 最 终 收 敛 到 正确 的 数值 。 















































1 eeooe 


人 一 个 


用 绿色 表示 被 选中 的 
候补 项 点 。 








洋 撤 拳 冯 一 站 沧 轨 





从 所 有 的 边 中 选 出 一 条 边 ， 此 处 选择 了 连接 A-B 的 边 。 然 后 ， 分 别 计算 这 条 边 从 一 端 到 另 一 端的 权重 
计算 方法 是 “顶点 原本 的 权重 + 边 的 权重 "。 只 要 按 顺 序 分 别 计算 两 个 方向 的 权重 即 可 , 从 哪 一 端 开始 
都 没有 问题 。 此 处 我 们 选择 按 项 点 权重 从 小 到 大 的 方向 开始 计算 。 





















































用 检 色 表示 路 径 。 








A 的 权重 小 于 B， 因 此 先 计算 从 A 到 B 的 权 如 果 计 算 结果 小 于 项 点 的 值 ， 就 更 新 这 个 值 。 
人 A 的 权重 是 0, 边 A-B 的 权重 是 9, 因此 A 弄 顶点 B 的 权重 是 无 穷 大 ， 比 9 大 ， 所 以 把 它 更 
0 




















的 权重 是 





+9=9。 新 为 9。 更 新 时 需要 记录 计算 的 是 从 哪个 顶点 
到 该 顶点 的 路 径 。 
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图 


流 浅 否 


1 beoeo 








接 下 来 计算 从 B 到 A 的 权重 。B 的 权重 为 9, 从 B 到 A 的 权 习 
为 现在 的 值 更 小 ， 所 以 不 更 新 。 

















数值 更 新 了 ， 顶 点 C 的 权重 变 成 了 2。 





从 权重 较 大 的 项 点 到 
较 小 的 项 点 时 ， 只 

边 的 权重 不 为 负 ， 就 
不 会 更 新 权重 





对 所 有 的 边 都 执行 同样 
的 操作 。 在 执行 顺序 上 
没有 特定 要 求 ， 此 处 我 
们 选择 从 靠近 左 侧 的 边 
开始 计算 。 先 选 出 一 条 











此 处 顶点 B 因为 边 B-C 而 更 新 了 
权重 ， 所 以 路 径 从 之 前 的 A-B 变 
为 了 现在 的 B-C。 因 此 A-B 不 再 
以 梭 色 表示 ， 而 B-C 变 为 橙色 。 


下 一 上 








详 毛 闫 世 - 烤 分 导 











重 又 更 新 了 。 此 时 就 能 看 出 ， 从 顶点 A 前 往 项 点 次 的 权重 更 小 。 









































luvwo 








更 新 边 C-D 和 边 C-F。 ' ”更 新 完 所 有 的 边 后 , 第 1 轮 更 新 就 结束 了 。 接 着 , 重 





























复 对 所 有 边 的 更 新 操作 , 直到 权重 不 能 被 更 新 为 止 。 



























































图 

的 

搜 

索 
第 2 轮 更 新 也 结束 了 。 顶 点 B 的 权 和 变 ' ”第 3 轮 更 新 结束 ， 所 有 项 点 的 权重 都 不 再 更 
了 7， 顶 点 E 的 权重 从 9 变 成 了 8。 接 着 ， ”新 ， 操 作 到 此 为 止 。 算 法 的 搜索 流程 也 就 此 结 
行 一 次 更 新 操作 。 ， ， 束 ， 我 们 找到 了 从 起 点 到 其 余 各 个 项 点 的 最 短 
根据 搜索 结果 可 知 ， 从 起 点 A 到 终点 G 的 最 短路 径 是 A-C-D-F-G， 权 寻 

O 

9 

4 
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将 图 的 项 点 数 设 为 n、 边 数 设 为 m， 我 们 来 思考 一 下 贝尔 曼 - 福特 算法 的 时 间 复 杂 度 
是 多 少 。 该 算法 经 过 n 轮 更 新 操作 后 就 会 停止 ， 而 在 每 弱 更 新 操作 中 都 需要 对 各 个 边 进行 
1 次 确认 ， 因 此 1 轮 更 新 所 花费 的 时 间 就 是 O(m) ， 整 体 的 时 间 复 杂 度 就 是 O(nm) 。 

为 了 便于 说 明 ， 前 面 的 讲解 以 无 向 图 为 例 ， 但 在 有 向 图 中 同样 可 以 求解 最 短路 径 问 
题 。 选 出 一 条 边 并 计算 顶点 的 权重 时 ， 无 向 图 中 的 计算 如 前 文 步骤 @3~O6 所 示 ， 两 个 
方向 都 要 计算 ， 而 在 有 向 图 中 只 按照 边 所 指向 的 那个 方向 来 计算 就 可 以 了 。 















































六 烩 匠 击 - 徊 分 当 


|” 补充 说 明 


计算 最 短路 径 时 ， 边 的 权重 代表 的 通常 都 是 时 间 、 距 离 或 者 路 费 等 ， 因 此 基本 都 是 
非 负 数 ?。 不 过 ， 即 便 权重 为 负 ， 贝 尔 曼 - 福特 算法 也 可 以 正常 运行 。 

但 是 ， 如 果 在 一 个 闭环 中 边 的 权重 总 和 是 负数 ， 那 么 只 要 不 断 遍 历 这 个 闭环 ， 路 径 
的 权重 就 能 不 断 减 小 ， 也 就 是 说 根本 不 存在 最 短路 径 。 遇 到 这 种 对 顶点 进行 n 次 更 新 操 
作 后 仍 能 继续 更 新 的 情况 ， 就 可 以 直接 认定 它 “ 不 存在 最 短路 径 ”。 

另外 ， 如 果 使 用 4-5 节 将 会 介绍 的 狄 克 斯 特 拉 算 法 ， 那 么 当 输 入 的 权重 为 负 时 还 有 
可 能 无 法 得 出 正确 的 答案 。 

CO 参考: 4-5 狄 克 斯 特 拉 算 法 







































































贝尔 曼 - 福 特 算法 的 名 称 取 自 其 创始 和 人 理 查 德 . 贝尔 曼 和 莱 斯 特 : 福特 的 名 字 。 贝 尔 曼 也 
为 提出 了 该 算法 中 的 一 个 重要 分 类 “动态 规划 ”而 被 世人 所 熟知 。 





























中 指 不 是 负数 的 实数 ， 即 0 和 正 数 。 


1 weoeo 





与 前 面 提 到 的 贝尔 曼 - 福特 算法 类 似 ， 狄 区 斯 特 拉 〈Dijkstra ) 算法 也 是 求解 最 短路 径 问题 
的 算法 ， 使 用 它 可 以 求 得 从 起 点 到 终点 的 路 径 中 权重 总 和 最 小 的 那 条 路 径路 径 。 


这 里 我 们 设 A 为 起 
点 、G 为 终点 ， 来 讲 
解 狄 克 斯 特 拉 算 法 。 





这 个 权重 和 贝尔 曼 - 福 
特 算法 中 的 权重 所 代表 
的 意思 一 样 ， 都 是 最 短路 
径 的 暂 定 距离 。 








: 起 点 为 0， 其 他 项 点 为 无 穷 大 ( ~ )。 





首先 设置 各 个 项 点 的 初始 权 习 
































5 
用 绿色 表示 候补 项 点 。 
狄 
克 
斯 
特 
拉 
算 
法 














用 红色 表示 目前 所 在 的 项 点 。 




















从 起 点 出 发 寻找 可 以 从 目前 所 在 的 达 且 尚未 被 搜索 
过 的 项 点 ， 此 处 为 顶点 B 和 项 点 C， 将 它们 设 
为 下 一 步 的 候补 项 点 。 

















0+5=5 








计算 各 个 候补 项 点 的 权重 。 计 算 方法 是 “目前 所 在 如 果 计 算 结 果 小 于 候补 项 点 的 值 ， 就 更 新 这 个 
+ 目前 所 在 顶点 到 候补 项 点 的 权重 "。 比 值 。 顶 点 B 和 顶点 C 现 在 的 权重 都 是 无 穷 大 ， 
如 起 点 A 的 权重 是 0, 那么 项 点 B 的 权重 就 是 0+2=2。 大 于 计算 结果 ， 所 以 更 新 这 两 个 顶点 的 值 。 

用 同样 的 方法 计算 顶点 C， 结 果 就 是 0+5=5。 
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图 


流 浅 于 


从 候补 项 点 中 选 出 权重 最 小 的 顶点 。 此 处 B 的 权重  ， ”确定 了 最 短路 径 ， 移 动 到 顶点 B。 
最 小 , 那么 路 径 A-B 就 是 从 起 点 A 到 顶点 B 的 最 
短路 径 。 因 为 如 果 要 走 别 的 路 径 , 那么 必定 会 经 过 
顶点 C， 其 权重 也 就 必定 会 高 于 A-B 这 条 路 径 。 
































将 可 以 从 项 点 B 直 达 的 顶点 设 为 新 的 候补 项 相同 的 方法 计算 名 个 候补 顶点 的 权重 。 从 B 
点 ， 于 是 顶点 D 和 顶点 E 也 成 为 了 候补 。 目 前 C 的 权重 为 2+6=8， 比 C 当 前 的 权重 5 大 ， 
有 三 个 候补 项 点 C、D、E。 ， 此 不 更 新 这 个 值 。 




















狄 克 斯 特 拉 算 法 的 名 称 取 自 该 算法 的 提出 者 埃 德 斯 加 狄 克 斯 特 拉 ， 他 在 1972 年 获得 了 
图 灵 奖 。 























1 oo 


重复 执行 同样 的 操作 直到 到 达 终 点 G 为 止 。 
移动 到 顶点 D 后 算出 了 E 的 权 寻 
为 3+4=7 )。 现 在 
都 为 5， 所 以 选择 哪 一 个 都 可 以 。 


























就 像 这样 ， 狄 克 斯 特 
拉 算 法 一 边 逐 一 确 


定 起 点 到 各 个 顶点 
的 最 短路 径 , 一 边 对 
图 进行 搜索 。 








最 小 ， 





A-B-D 这 条 路 径 是 通 
过 逐步 从 候补 项 点 中 选 
择 权重 最 小 的 顶点 来 得 
到 的 ， 所 以 如 果 经 过 其 
他 项 点 到 达 D， 其 权重 
必定 会 大 于 这 条 路 径 。 





























此 处 我 们 选择 了 C， 于 是 起 点 A 到 项 点 C 的 最 


短路 径 便 确 定 了 。 











并 兰 项 半 进 演 
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图 


流 浅 否 


1 oo- 








移动 到 C 后 , 顶点 F 成 为 了 新 的 候补 项 点， 且 F 
的 权重 被 更 新 为 13。 此 时 的 候补 顶点 中 ，E 为 
5、F 为 13， 所 以 





移动 到 E。G 成 了 新 的 候补 顶点 , 其 权重 也 被 更 
新 为 14。 此 时 的 候补 顶点 中 , F 为 13、G 为 14， 
所 以 选择 了 F。 由 此 , 起 点 A 到 顶点 F 的 最 短路 




















径 也 就 确定 了 下 来 。 





我 们 选择 了 权重 更 小 的 E， 起 点 A 到 顶点 E 的 
最 短路 径 也 就 确定 了 下 来 。 

















移动 到 F。 顶 点 6G 的 权重 计算 结果 为 13+7=20， 
比 现在 的 值 14 要 大 ,因此 不 更 新 它 。 由 于 候补 
顶点 只 剩 G 了 ， 所 以 选择 G， 并 确定 了 起 点 A 
到 顶点 G 的 最 短路 径 。 



































最 终 得 到 的 这 颗 橙 色 的 树 就 
是 最 短路 径 树 ， 它 表示 了 起 点 
到 达 各 个 项 点 的 最 短路 径 。 


用 粗 线条 标注 的 就 是 从 起 点 A 到 终点 G 的 最 
短路 径 。 





比 起 需要 对 所 有 的 边 都 重复 计算 权重 和 更 新 权重 的 贝尔 曼 - 福特 算法 ， 狄 克 斯 特 拉 
算法 多 了 一 步 选择 项 点 的 操作 ， 这 使 得 它 在 求 最 短路 径 上 更 为 高 效 。 

将 图 的 项 点 数 设 为 n、 边 数 设 为 mm， 那么 如 果 事 先 不 进行 任何 处 理 ， 该 算法 的 时 
间 复 杂 度 就 是 O(n?)。 不 过 ， 如 果 对 数据 结构 进行 优化 ， 那 么 时 间 复 杂 度 就 会 变 为 
O (m+nlogn)o 








六 站 上 兰 革 可 进 答 
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> 补充 说 明 


法 和 贝尔 曼 - 福特 算 ; 











































































































图 妈 中 求解 最 短路 径 问 题 。 

果 图 中 含有 负数 权重 ， 狄 克 斯 特 

素 会 无 法 得 出 正确 答案 ， 这 一 点 和 贝尔 曼 - 福特 
不 同 。 比 如 右边 这 个 图 中 ，A-C-B-G 为 






































的 最 短路 径 ， 权 重 为 4+(-3)+1=2。 

然而 ， 如 果 用 狄 克 斯 特 拉 算 法 来 求解 ， 得 到 的 
却 是 下 面 这 样 的 最 短路 径 树 。 从 起 点 A 到 终点 G 
的 最 短路 径 为 A-B-G， 权 重 为 3。 这 个 答案 显然 是 
错误 的 。 







































































最 初 B 和 C 成 为 候补 项 点 时 , B 的 权重 更 小 ， 
因此 确定 了 A-B 路 径 。 但 是 ， 因 为 有 负数 
权重 ， 所 以 实际 上 A-C-B 路 径 的 整体 权重 
更 小 。 只 是 狄 克 斯 特 拉 算 法 一 开始 还 不 知道 
C-B 路 径 的 存在 ， 导 致 出 现 了 错误 。 




























































































4-4 节 中 曾 讲 过 ， 如 果 闭 环 中 有 负数 权重 ， 就 不 存在 最 短路 径 。 贝 尔 曼 - 福特 算 ; 
可 以 直接 认定 不 存在 最 短路 径 ， 但 在 狄 克 斯 特 拉 算 法 中 ， 即 便 不 存在 最 短路 径 ， 它 也 会 
算出 一 个 错误 的 最 短路 径 出 来 。 因 此 ， 有 负数 权重 时 不 能 使 用 狄 克 斯 特 拉 算 法 。 

总 的 来 说 ， 就 是 不 存在 负数 权重 时 ， 更 适合 使 用 效率 较 高 的 狄 克 斯 特 拉 算 法 ， 而 存 
在 负数 权重 时 ， 即 便 较 为 耗 时 ， 也 应 该 使 用 可 以 得 到 正确 答案 的 贝尔 曼 - 福特 算法 。 
参考 : 4-4 贝尔 曼 - 福特 算法 





































































































































































































1 bo 一 


A* (A-Star ) 算法 也 是 一 种 在 图 中 求解 最 得 路径 问 题 的 算法 ， 由 狄 区 斯 特 拉 算 法 发 展 而 来 。 
狄 区 斯 特 拉 算 法 会 从 离 起 点 近 的 顶点 开始 ， 按 顺序 求 出 起 点 到 各 个 顶点 的 最 短路 径 。 也 就 是 说 ， 
一 些 离 终点 较 远 的 顶点 的 最 短路 径 也 会 被 计算 出 来 ， 但 这 部 分 其 实 是 无 用 的 。 与 之 不 同 ，A* 就 
会 预先 估算 一 个 值 ， 并 利用 这 个 值 来 省 去 一 些 无 用 的 计算 。 









































加 











试 着 用 狄 克 














的 最 短路 径 I 





斯 特 拉 算 法 来 求 该 
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以 这 个 设 定 为 前 提 ， 


法 来 求 最 短路 径 。 

















狄 克 斯 特 拉 算 























将 迷宫 看 作 是 一 个 图 ， 其 中 每 个 方块 都 是 一 个 顶点， 各 
项 点 间 的 距离 ( 权重 ) 都 为 1。 














除 白 色 方 块 
以 外 的 区 域 ， 
也 就 是 大 部 
分 区 域 都 被 
搜索 过 。 




















的 
数字 表示 从 和 )， 蓝 色 和 楼 色 的 方块 表 
示 搜索 过 的 区 域 ， 楼 色 方块 同时 还 表示 从 S 到 G 的 最 短路 径 。 
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狄 克 斯 特 拉 算 法 只 根据 起 点 到 候补 顶点 的 距离 。 ， ”而 A 算法 不 仅 会 考虑 从 起 点 到 候补 顶点 的 距离 ， 
来 决定 下 一 个 顶点。 因此 ， 它 无 法 发 现 蓝 色 箭 ' ”还 会 考虑 从 当前 所 在 顶点 到 终点 的 估算 距离 。 
头 所 指 的 这 两 条 路 径 其 实 离 终点 越 来 越 远 ， 同 ”' ”这 个 估算 距离 可 以 自由 设 定 ， 此 处 我 们 用 的 是 
样 会 继续 搜索 。 ' ”将 项 点 到 终点 的 直线 距离 四 舍 五 入 后 的 值 。 
































所 在 项 点 到 起 
点 的 实际 距离 ， 
再 加 上 该 顶点 
到 终点 的 距离 
估算 值 ,就 是 从 
起 点 到 终点 的 
估算 距离 。 

















接 下 来 , 就 试 着 用 A* 算 法 来 求解 吧 。 首 先 把 ”' ”分 别 计算 起 点 周围 每 个 项 点 的 权重 。 计 算 方 法 
起 点 设 为 搜索 完毕 状态 。 搜 索 完 的 点 都 用 蓝 色 是 “从 起 点 到 该 顶点 的 距离 ”( 方块 左下 ) 加 上 
表示 。 ' “距离 估算 值 ”( 方块 右 下 )。 









































如 步骤 OG 中 方块 右 下 角 的 数字 所 示 , 由 人 工 预 先 设 定 的 估算 距离 被 称 为 “距离 估算 值 "。 如 
果 事 先 根据 已 知 信息 设 定 合适 的 距离 估算 值 ， 再 将 它 作为 启发 信息 辅助 计算 ， 搜 索 就 会 变 得 
更 加 高 效 ?。 这 里 我 们 只 知道 终点 所 在 位 置 ， 不 知道 该 如 何 通 往 终 点 ,所 以 使 用 了 直线 距离 。 












































中 因此 ,这 样 的 算法 也 被 称 为 启发 式 算法 。 一 一 编者 注 
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点 ， 用 森 色 表 































































































最 小 的 项 
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选择 一 个 权 
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的 一 个 顶点 


选择 距离 最 短 
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三 


计算 搜索 完毕 的 项 点 到 下 
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将 选 好 的 项 点 设 为 搜索 
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图 
会 雪 讲 往 高 终点 
索 太 远 的 区 域 。 
10 8 
7 i | 
搜索 完毕 。 效 率 比 狄 克 斯 特 拉 算 法 的 高 了 很 多 。 
如 果 我 们 能 得 到 一 些 启 发 信息 ， 即 各 个 顶点 到 终点 的 大 致 距离 〈 这 个 距离 不 需 是 准 
确 的 值 ) 我 们 就 能 使 用 A* 算法 。 当 然 ， 有 时 这 类 信息 是 完全 无 法 估算 的 ， 这 时 就 不 能 
使 用 A* 算法 。 
距离 估算 值 越 接 近 当 前 顶点 到 终点 的 实际 值 ，A* 算法 的 搜索 效率 也 就 越 高 ， 反 过 
py PI IF IPP OI SI Oe 那么 该 算法 的 效率 可 能 会 比 狄 克 斯 特 拉 算 法 的 
还 要 低 。 如 果 差 距 再 大 一 些 ， 甚 至 可 能 无 法 得 到 正确 答案 。 
A NA A NS AINA A SNA NR 4 是 如 果 ; 
设 定 合适 的 距离 估算 值 ， 效 率 会 变 差 )。 
> 应 用 示例 
A* 算法 在 游戏 编程 中 经 常 被 用 于 计算 敌人 追赶 玩家 时 的 行动 路 线 等 ， 但 由 于 该 算法 
的 计算 量 较 大 ， 所 以 可 能 会 使 游戏 整体 的 运行 速度 变 慢 。 因 此 在 实际 编程 时 ， 需 要 考虑 
结合 其 他 算法 ， 或 者 根据 具体 的 应 用 场景 做 出 相应 调整 。 
| 
O 
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和 互联 网 中 不 可 或 缺 的 安全 技术 


通过 互联 网 交换 数据 时 ， 数 据 要 经 过 各 种 各 样 的 网 络 和 设备 才能 传 到 对 方 那 里 。 数 据 在 传 
输 过 程 中 有 可 能 会 经 过 某 些 恶意 用 户 的 设备 ， 从 而 导致 内 容 被 盗 取 。 

因此 ， 要 想 安 全 地 使 用 互联 网 ， 安 全 技术 是 不 可 或 缺 的。 本 章 将 要 学 习 的 就 是 保障 安全 的 
各 种 算法 和 利用 了 这 些 算法 的 机 制 。 


和 传输 数据 时 的 四 个 问题 


首先 ， 介 绍 一 下 用 互联 网 传输 数据 时 可 能 会 发 生 的 四 个 主要 问题 。 


> 窃听 
A 向 B 发 送 的 消息 可 能 会 在 传输 途中 被 X 偷 看 (如 右 图 )。 这 就 是 “ 禄 听 ”。 
internet 


> 假冒 

A 以 为 向 B 发送 了 消息 ,然而 B 有 可 能 是 X 冒 充 的 (如 下 页 上 图 ); 反 过 来 , B 以 为 从 A 
那里 收 到 了 消息 ， 然 而 A 也 有 可 能 是 X 冒充 的 。 

这 种 问题 就 叫 作 “假冒 ”。 








internet internet 5 
全 
8 时: 石 四 


济 粮 关 纱 灶 


> 算 改 internet 


即便 B 确实 收 到 了 A 发 送 的 消息 ， 但 也 有 可 能 像 右 图 
这 样 ， 该 消息 的 内 容 在 途中 就 被 又 更 改 了 。 


这 种 行为 就 叫 作 “ 复 改 "。 除 了 被 第 三 者 自 改 外 ， 通 人 
信 故 障 导 致 的 数据 损坏 也 可 能 会 使 消息 内 容 发 生变 化 。 % 入 


> 事后 否认 
B 从 A 那里 收 到 了 消息 ， 但 作为 消息 发 送 者 的 A 可 党 
能 对 B 抱 有 恶意 ， 并 在 事后 声称 “这 不 是 我 发 送 的 消息 ” 
(参考 下 图 )。 
这 种 情况 会 导致 互联 网 上 的 商业 交易 或 合同 签署 无 法 成 立 。 这 种 行为 便 是 “事后 否认 ”。 


internet 事后 否认 
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四 个 主要 问题 到 这 里 就 介绍 完毕 了 。 这 些 问题 不 光 发 生 在 用 户 之 间 交 流 的 时 候 ， 也 有 可 能 


发 生 在 用 户 浏览 网 页 的 时 候 。 


1 解决 这 些 问 题 的 安全 技术 


为 了 解决 这 些 问题 ， 我 们 需要 使 用 哪些 安全 技术 
呢 ? 来 简单 了 解 一 下 每 个 问题 的 应 对 方法 吧 。 

为 了 应 对 第 一 个 问题 “窃听 ”， 我 们 会 使 用 “加 密 ” 
技术 。 

为 了 应 对 第 二 个 问题 “假冒 "， 我 们 会 使 用 “消息 
认证 码 ”( 下 图 左 ) 或 “数字 签名 ”( 下 图 右 ) 技术 。 

为 了 应 对 第 三 个 问题 “ 算 改 ,我 们 同样 会 使 用 
“消息 认证 码 ” 或 “数字 签名 ”技术 。 其 中 “数字 签名 ” 
技术 还 可 以 用 于 预防 第 四 个 问题 “事后 否认 ”。 


nternet 消息 认证 码 


1 第 5 章 的 知识 点 


问题 和 相应 的 解决 方法 可 总 结 成 如 下 页 表格 。 
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人 @ 事 后 否认 数 


“数字 签名 ”技术 存在 “无 法 确认 公开 密 钥 的 制作 者 ”这 一 问题 。 要 想 解 决 这 个 问题 ， 可 以 
使 用 “数字 证 书 ”技术 。 
本 章 就 将 详细 讲解 这 些 安全 技术 。 


1 --- 








在 现代 互联 网 社会 中 ， 加 密 技 术 是 不 可 或 缺 的 。 那 么 对 数据 进行 加 密 和 解密 时 ， 计 算 机 会 
进行 哪些 处 理 呢 ? 这 一 节 我 们 将 讲解 加 密 技 术 的 必要 性 和 基本 原理 。 




















假设 和 A 想 通 过 互联 网 向 B 发 送 消息 。 数 据 要 经 ， ”数据 可 能 会 被 第 三 者 恶意 窃 
过 互联 网 上 各 种 各 样 的 网 络 和 设备 才能 到 达 B 
里 。 如 果 像 上 图 这 样 直接 发 送 数据 的 话 












































为 此 ， 我 们 需要 给 想 要 保 
密 的 数据 加 密 。 加 密 后 的 
数据 被 称 为 “ 密 文 ”。 











internet 


把 密 文 发 送 给 B。 





internet 





B 收 到 密 文 后 , 需要 解除 加 密 才能 得 到 原本 的 数据 。 





把 密 文 恢复 为 原本 数据 的 操作 就 叫 作 “解密 "。 


internet 





像 这 样 对 数据 进行 加 密 ， 就 不 ) 











担心 会 被 人 窃听 了 。 
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在 现代 互联 网 社会 中 ， 加 密 技术 变 得 十 分 重要 。 这 里 ， 我 们 再 来 说 明 一 下 加 密 的 具体 操作 。 
首先 ， 计 算 机 会 用 由 0 和 1 这 两 个 数字 表示 的 二 进 制 来 管理 所 有 数据 。 如 下 图 所 示 ， 
数据 虽然 有 文本 、 音 频 、 图 像 等 不 同 的 形式 ， 但 是 在 计算 机 中 都 是 用 二 进 制 来 表示 的 。 
















































































在 此 基础 上 ， 我 们 来 思考 如 何 加 密 数据 。 

对 计算 机 来 说 ， 数 据 就 是 一 串 有 意义 的 数字 罗列 。 密 文 也 是 数字 罗列 ， 只 不 过 它 
计算 机 无 法 理解 的 无 规律 的 数字 罗列 。 

也 就 是 说 ， 加 密 就 是 数据 经 过 某 种 运算 后 ， 变 成 计算 机 无 法 理解 的 数 的 过 程 〈 请 参 
考 下 图 )。 




















在 加 密 运算 上 会 用 到 “ 密 钥 ”。 所 以 加 密 就 是 用 密 钥 对 数据 进行 数值 运算 ， 把 数据 
变 成 第 三 者 无 法 理解 的 形式 的 过 程 〈 请 参考 下 图 )。 


像 这 村 


羊 ， 通 过 窗 钥 进行 数值 计算 ， 把 密 文 恢复 成 原本 数据 的 




















 ， 将 数据 变 成 第 三 者 的 计算 机 无 法 理解 的 形式 ， 然 后 再 将 其 恢复 成 原本 数据 
的 一 系列 操作 就 是 加 密 技 术 。 
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哈 希 函数 可 以 把 给 定 的 数据 转换 成 固定 长 度 的 无 规律 数值 。 转 换 后 的 无 规律 数值 可 以 作为 
数据 摘要 应 用 于 各 种 各 样 的 场景 。 
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将 数据 输入 到 哈 








十 六 进 制 是 用 数字 0 ~ 9 和 

守节 和 ~ 作 总 计 秆 突 个 字条 

来 表示 数据 的 一 种 方法 。 
7f0579bc2d 








输出 固定 长 度 的 无 规律 数值 。 把 哈 希 函数 想像 成 搅拌 数据 的 搅拌 机 就 很 容易 理解 了 。 输 























值 就 是 “ 哈 希 值 " 。 哈 希 值 虽然 是 数字 ， 但 多 用 十 六 进 制 来 表示 。 
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计算 机 会 用 由 0 和 1 这 两 

数字 表示 的 二 进 制 来 管 

理 所 有 的 数据 。 虽 然 哈 希 

值 是 用 十 六 进 制 表示 的 ， 

但 它 也 是 数据 ， 在 计算 机 

内 部 同样 要 用 二 进 制 来 进 

pT 行 管理 。 也 就 是 说 ， 哈 希 

7f0579bc2d 函数 实际 上 是 在 计算 机 内 
部 进行 着 某 种 运算 的 。 
































流 狼 址 录 





7f0579bc2d ， 4f07fa9e12 


以 此 为 前 提 ， 我 们 再 来 看 看 哈 希 函数 的 特征 即使 输入 了 相当 大 的 数据 ， 输 出 的 哈 希 值 的 长 
第 一 个 特征 是 输出 的 哈 希 值 数 据 长 度 不 变 。 ' ， 度 也 保持 不 变 。 











b37cf3c041 | 7f0579bc2d 二 7f0579bc2d 





同样 地 ， 不 管 输入 的 数据 多 小 ， 哈 希 值 的 长 度 第 二 个 特征 是 如 果 输 入 的 数据 相同 ， 那 么 输出 
仍然 相同 。 的 哈 希 值 也 必定 相同 。 
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哈 希 
7f0579bc2d c8ed2af375 : 7f0579bc2d 二 7f0579bc2d A 








第 三 个 特征 是 即使 输入 的 数据 相似 ， 但 哪怕 它 寺 征 是 即使 输入 的 两 个 数据 完全 不 同 ， 输 
们 只 有 一 比特 的 差别 ， 那 么 输出 的 哈 希 值 也 会 I 4 可 能 是 相同 的 ， 虽 然 出 现 这 种 情 
有 很 大 的 差异 。 输 入 相似 的 数据 并 不 会 导致 输 
出 的 哈 希 值 也 相似 。 





















































7f0579bc2d ' 7f0579bc2d 











第 五 个 特征 是 不 可 能 从 哈 希 值 反 向 推算 出 原本 的 数 。 ”最 后 一 个 特征 是 求 哈 希 值 的 计算 相对 容易 。 
据 。 输 入 和 输出 不 可 逆 这 一 点 和 加 密 有 很 大 不 同 。 。 ， 











哈 希 函数 可 以 应 用 于 各 种 各 样 的 场景 。 本 书 详细 讲解 了 哈 希 函数 在 哈 希 表 和 消息 认证 
中 的 应 用 。 

人 参考 : 1-6 哈 希 表 

参考: 5-8 消息 认证 码 
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哈 希 函数 的 算法 中 具有 代表 性 的 是 MD54、SHA-12 和 SHA-2 等 。 其 中 SHA-2 是 现 
在 应 用 较为 广泛 的 一 个 ， 而 MD5 和 SHA-1 存在 安全 隐患 ， 不 推荐 使 用 。 

不 同 算法 的 计算 方式 也 会 有 所 不 同 ， 比 如 SHA-1 需要 经 过 数 百 次 的 加 法 和 移 位 运算 
才能 生成 哈 希 值 。 

虽然 本 节 中 讲 过 如 果 输 入 的 数据 相同 ， 那 么 输出 的 哈 希 值 也 必定 相同 ， 但 这 是 在 使 
用 同一 个 算法 的 前 提 下 得 出 的 结论 。 若 使 用 的 算法 不 同 ， 那 么 就 算 输入 的 数据 相同 ， 得 
到 的 哈 希 值 也 是 不 同 的 。 







































































> 应 用 示例 


将 用 户 输入 的 密码 保存 到 服务 器 时 也 需要 用 到 哈 希 函数 。 




















如 果 把 密码 直接 保存 到 服务 器 ， 可 能 会 被 第 三 者 窃听 ， 因 此 需要 算出 密码 的 哈 希 
值 ， 并 只 存储 哈 希 值 。 当 用 户 输入 密码 时 ， 先 算出 该 输入 密码 的 哈 希 值 ， 再 把 它 和 服务 
器 中 的 哈 希 值 进行 比 对 。 这 样 一 来 ， 就 算 保存 的 哈 希 值 暴露 了 ， 鉴 于 上 文中 提 到 的 哈 希 
函数 的 第 五 个 特征 〈 输 入 输出 不 可 逆 )， 第 三 者 也 无 法 得 知 原本 的 密码 。 

就 像 这 样 ， 使 用 哈 希 函数 可 以 更 安全 地 实现 基于 密码 的 用 户 认 证 。 















































四 Message Digest Algorithm 5 的 缩写 。 
@ SHA 是 Secure Hash Algorithm 的 缩写 。 
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5 - 4 | 共享 密 铀 加 密 


加 蜜 数据 的 方法 可 以 分 为 两 种 : 加 密 和 解密 都 使 用 相同 密 钥 的 “共享 密 钥 加 密 ” 和 分 别 使 
日 不 同 密 钥 的 “公开 窗 钥 加 密 "。 本 闻 将 讲解 共享 密 钥 加 密 的 机 制 及 其 相关 问题 。 





0 密 是 加 密 和 
相同 密 钥 的 
式 。 由 于 使 
用 的 密 钥 相同 ， 所 以 这 
种 算法 也 被 称 为 “对 称 
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我 们 先 从 整体 上 来 了 解 一 下 共享 密 钥 加 密 的 处 窃听 的 风险 ， 所 以 需要 把 想 要 保密 的 
理 流程 。 假 设 人 准备 通过 互联 网 向 B 发 送 数 据 。 再 发 送 。 
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旦 对 浇 时 性 准 














人 将 密 文 发 送 给 B。 


























B 收 到 密 文 后 ， 使 用 相同 的 密 钥 对 其 进行 解密 。 这 样 ，B 就 取得 了 原本 的 数据 。 只 要 是 加 密 好 的 数据 ， 
就 算 被 第 三 者 恶意 窃听 也 无 须 担心 。 

















实现 共享 密 钥 加 密 的 算法 有 凯 撤 密码 、AES?、DES8、 动 态 口令 等 ， 其 中 AES 的 应 上 
为 广泛 。 











Q@ ”Advanced Encryption Standard 的 缩写 。 
@) Data Encryption Standard 的 缩写 。 
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接 下 来 想 一 想 共 享 密 钥 加 密 中 的 问题 。 让 我 们 
到 B 收 到 A 发 送 的 密 文 的 时 
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8 一 一 加 3 
5 本 




















里 假设 A 和 B 无 法 直接 沟通 ，B 不 知道 加 密 。 ， ”人 需要 通过 某 种 手段 将 密 钥 交 给 B。 和 窗 文 一 
的 是 什么 密 钥 。 ，， 样 ，A 又 在 互联 网 上 向 B 发 送 了 密 钥 。 
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这 就 是 共享 
密 钥 加 密 最 
大 的 问题 。 


















































但 是 三 ， 该 密 钥 也 可 能 会 被 X 窃 听 。 这 样 一 来 ， 
X 也 可 以 使 用 密 钥 对 密 文 进行 解密 了 。 














既然 密 钥 有 被 第 三 者 窃听 的 风险 ， 那 是 不 是 也 可 以 先 加 密 密 钥 再 发 送 呢 ?使 用 这 种 
方式 ， 又 会 产生 如 何 把 加 密 密 钥 的 密 钥 发 送 多 Poy GPP Oy 开始 的 问题 。 
此 需要 找到 可 以 把 密 钥 安全 送出 的 方法 ， 这 就 是 “ 密 钥 分 配 问 题 ”。 

要 想 解决 这 个 问题 ， 可 以 使 用 “ 密 钥 交换 协议 ”和 “公开 密 钥 加 密 ” 两 种 方法 。 后 
面 本 书 将 会 对 这 两 种 方法 进行 详细 说 明 。 
他 参考 : 5-5 公开 密 钥 加 密 
CC 参考: 5-7 迪 菲 - 赫 尔 曼 密 钥 交 换 























世界 大 战 中 ， 德 军 所 用 的 “ 恩 尼 格 玛 密码 机 ”( Enigma ) 使 用 的 
加 密 二 人 让 中 德军 将 一 个 月 的 密 钥 记 录 成 表格 进行 交接 ， 因 此 
密 钥 分 配 并 不 是 该 密码 机 的 弱点 。 然 而 ， 使 用 该 密码 机 加 密 后 的 密 文 会 周期 性 
地 出 现 相同 的 文字 ， 英 国 的 数学 家 艾 伦 ' 图 灵 就 是 利用 这 一 点 破译 了 密 文 ， 给 
盟 军 的 胜利 带 来 了 极 大 的 帮助 。 

现在 被 普遍 使 用 的 加 密 算法 即便 连续 发 送 相似 的 文字 ， 也 难以 被 破解 。 
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公开 密 铀 加 密 


公开 密 钥 加 密 是 加 密 和 解密 使 用 不 同 密 钥 的 一 种 加 密 方 法 。 由 于 使 用 的 密 钥 不 同 ， 所 以 这 种 算 
法 也 被 称 为 “ 非 对 称 加 密 ”。 加 密 用 的 密 钥 叫 作 “公开 密 钥 ”， 解 密 用 的 叫 作 “ 私 有 密 钥 ”。 
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我 们 先 从 整体 上 来 了 解 一 下 公 了 





公开 密 钥 用 P ( public key ) 来 表示 ， 


私有 密 钥 用 S ( secret key ) 来 表示 。 
Rl 98 



























































| 接收 方 B 来 生成 公开 密 钥 9 和 私 


| 上 一 
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然后 把 公开 密 钥 发 送 给 A。 















































B 发 来 的 公开 密 钥 加 密 数据 。 ， 。 A 将 密 文 发 送 给 B，B 再 使 用 私有 密 钥 对 密 文 进 
，， 行 解密 。 这 样 ，B 就 得 到 了 原本 的 数据 。 














实现 公开 密 钥 加 密 的 算法 有 RAS 算法 、 椭 圆 曲线 加 密 算法 等 ， 其 中 使 用 最 为 广泛 的 是 
RSA 算法 。RSA 算 法 由 其 开发 者 Rivest、Shamir、Adleman 的 首 字母 命名 而 来 ， 三 人 在 
2002 年 获得 了 图 灵 奖 。 
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internet 


公开 密 钥 和 密 文 都 是 通过 互联 网 传输 的 ， 
此 X 也 无 法 得 到 原本 的 数据 。 
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% 8 


此 外 ， 在 和 多 人 传输 数据 时 ， 使 用 公开 密 钥 加 
密 十 分 方便 。 来 看 一 个 具体 的 例子 吧 。 假 设 B 
预先 准备 好 了 公开 密 钥 和 私有 密 钥 。 






































与 共享 密 钥 加 密 不 同 的 是 ， 
公开 密 钥 加 密 不 会 出 现 密 
钥 分 配 问题 。 





























F 密 钥 无 法 解密 密 文 ， 
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公开 密 钥 是 不 怕 被 人 知道 的 ， 所 以 B 可 以 把 公 
开 密 钥 发 布 在 网 上 。 与 此 相反 ， 私 有 密 钥 不 能 
被 人 知道 ， 必 须 严 密 保管 。 
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时 34 


首先 在 网 上 取得 B 发 布 的 公开 密 
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8 一 一 加 








然后 用 它 加 密 要 发 送 的 数 所 





如 果 使 用 共享 密 钥 加 密 ， 密 钥 的 需求 数量 会 随 着 发 送 人 数 的 增多 而 急剧 增多 。 上 一 节 的 
例子 中 只 有 2 个 人 ， 因 此 只 需要 2 个 密 钥 , 但 5 人 就 需要 10 个 ，100 人 就 需要 4950 个 (7z 
人 数 ， 需 要 的 数量 便 是 < 一 )。 
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私有 密 钥 


internet 
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X 想 要 窃听 A 发 给 B 
公开 密 铀 Px 汪 和 私 


8 
家 外 


的 数据 ， 于 是 他 也 准备 了 
客 钥 Sx 由 。 





























B 用 私有 密 钥 对 收 到 的 密 文 进行 解密 ， 取 得 原 
本 的 数据 。 这 种 情况 就 不 需要 为 每 个 发 送 对 象 
都 准备 相对 应 的 密 钥 了 。 需 要 保密 的 私 
仅 由 接收 方 保管 ， 所 以 安全 性 也 更 高 。 












































不 过 ， 公 开 密 钥 加 密 存 在 公开 密 钥 可 靠 性 的 问 
题 。 让 我 们 回 到 B 生 成 公开 密 钥 和 私有 密 钥 的 
寺 候 。 在 接 下 来 的 说 明 中 ，B 生成 的 公开 密 钥 
Ps 甲 来 表示 、 私 密 钥 Se 由来 表示 。 
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X 把 公 玫 葵 换 成 自己 的 公开 窗 























公开 密 钥 Px 对 数据 加 密 。 
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于 是 公开 密 钥 Px 传 到 了 人 那里 。 由 于 公开 密 钥 
无 法 显示 自己 是 由 谁 生成 的 ， 所 以 A 不 会 发 现 
己 收 到 的 公 玫 已 经 被 人 替换 。 



























































abc internet 
PF 


2 58 
国名 


当 A 把 想 要 给 B 的 密 文 发 送出 去 后 ，X 接 收 了 


当 
这 个 密 文 。 
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记 这 个 密 文 由 X 生 成 的 公开 密 钥 Px 加 密 而 成 ， 所 以 


X 可 以 用 自己 的 私有 密 钥 Sx 对 密 文 进行 解密 。 
abc internet 
DZ 
s8 
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XX 成功 窃听 了 A 准备 发 送 给 


. 6 
os8 "区 2» 
Bs S94 


接 下 来 ， X 用 B 生 成 的 公开 密 钥 Ps 加密 数据 。 ' ”X 把 密 文 发 送 给 B， 这 个 密 文 由 B 发 出 的 公开 密 
钥 Ps 加 密 而 成 ， 所 以 B 可 以 用 自己 的 私有 密 钥 
Se 来 解密 。 从 收 到 密 文 到 解密 密 文 都 没 发 生 任何 
问题 ， 因 此 B 也 意识 不 到 数据 已 经 被 窃听 。 这 种 
中途 花 换 公开 密 钥 来 窃听 数据 的 攻击 方法 
d 作 “中 间 人 攻击 ” ( man-in-the-middle attack )。 
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多 补充 说 明 


公开 密 钥 的 可 靠 性 会 出 现 问题 ， 就 是 因为 A 无 法 判断 收 到 的 公开 密 
要 想 解决 这 个 问题 ， 就 要 用 到 之 后 会 讲 到 的 “数字 证 书 ”。 

公开 密 钥 加 密 还 有 一 个 问题 ， 那 就 是 加 密 和 解密 都 比较 耗 时 ， 所 以 这 种 方法 不 适用 
于 持续 发 送 零碎 数据 的 情况 。 要 想 解决 这 个 问题 ， 就 要 用 到 “混合 加 密 ”。 
人 参考: 5-6 混合 加 密 
参考 : 5-10 数字 证 书 









































要 想 找到 实现 公开 密 钥 加 密 的 算法 并 不 容易 。 考 虑 到 加 密 所 需 的 计 
足 如 下 条 件 。 


























db 可 以 使 用 某 个 数值 对 数据 进行 加 密 (计算 )。 
C@) 使 用 另 一 个 数值 对 加 密 数据 进行 计算 就 可 以 让 数据 恢复 原样 。 
(3) 无 法 从 一 种 密 钥 推 算出 另 一 种 密 钥 。 





稍微 思考 一 下 便 知道 ， 想 要 找到 满足 以 上 条 件 的 算法 难度 有 多 大 。 所 以 ，RSA 等 可 
以 实现 公开 密 钥 加 密 的 算法 的 提出 ， 对 当今 互联 网 社会 的 安全 有 着 重要 的 意义 。 
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混合 加 密 





共享 密 钥 加 密 存 在 无 法 安全 传输 密 钥 的 密 钥 分 配 问题 ， 公 开 密 钥 加 密 又 存在 加 密 解密 速度 
较 慢 的 问题 。 结 合 这 两 种 方法 以 实现 互补 的 一 种 加 密 方法 就 是 混合 加 密 。 
人 @ 参 考 : 5-4 共享 密 钥 加 密 
参考 : 5-5 公开 密 钥 加 密 
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在 混合 加 密 中 ， 要 用 处 理 速度 较 快 的 共享 密 钥 加 密 对 数据 进行 加 密 。 不 过 ， 加 密 时 使 用 的 密 钥 ， 则 需 
密 钥 分 配 问题 的 公 












































我 们 来 看 看 混合 加 密 具体 的 处 理 流程 。 假 设 A 人 更 用 处 理 速 度 较 快 的 共享 密 钥 加 密 对 数据 进行 
准备 通过 互联 网 向 B 发 送 数据 。 加 密 。 加 密 时 所 用 的 密 钥 在 解密 时 也 要 用 到 ， 
因此 人 A 需要 把 密 钥 发 送 给 B。 
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将 密 钥 通过 公开 密 钥 加 密 进行 加 密 后 ，A 就 可 
以 将 其 安全 地 发 送 给 B 了 。 因 此 ,作为 接收 方 ， 
需要 事先 生成 公开 密 钥 人 和 私有 密 钥 外 。 
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人 A 使 用 收 到 的 公开 密 钥 ， 对 共享 密 钥 加 密 中 需 














要 使 用 的 密 钥 进行 加 密 。 
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开 密 钥 发 送 给 A。 


oY © 


8 本 一 可 8 


人 将 加 密 后 的 密 钥 发 送 给 B。 
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这 样 ，A 就 把 共享 密 钥 加 密 中 使 有 
地 发 送 给 了 B。 











B 安 全 地 收 到 
了 原本 的 数据 。 














接 下 来 , A 只 要 将 使 用 这 个 密 钥 加 密 好 的 数据 发 送 给 B 即 可 。 加 密 数据 时 使 用 的 是 处 理 速 度 较 快 的 共享 
密 钥 加 密 。 
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像 这 样 ， 混 合 加 密 在 安全 性 和 处 理 速度 上 都 有 优势 。 能 够 为 网 络 提供 通信 安全 的 
SSL 协议 也 应 用 了 混合 加 密 方 法 。SSL 是 Secure Sockets Layer( 安 全 套 接 层 ) 的 简写 ， 
该 协议 经 过 版 本 升级 后 ， 现 在 已 正式 命名 为 TLS (Transport Layer Security， 传 输 层 安 
全 )。 但 是 ，SSL 这 个 名 字 在 人 们 心中 已 经 根深 蒂 固 ， 因 此 该 协议 现在 也 常 被 称 为 SSL 
协议 或 者 SSL/TLS 协议 。 











1 ww 一 





迪 非 - 赫 尔 曼 ( Diffie-Hellman ) 密 钥 交 换 是 一 种 可 以 在 通信 双方 之 间 安 全 交换 密 钥 的 方法 。 
这 种 方法 通过 将 双方 共有 的 秘密 数值 隐藏 在 公开 数值 相关 的 运算 中 ,来 实现 双方 之 间 密 钥 的 安 
全 交换 。 
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公式 进行 讲解 之 前 ， 我 们 先 通 过 图 片 来 理解 一 下 这 个 算法 的 概念 。 
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假设 有 一 种 方法 可 以 合 
成 两 个 密 钥 。 使 用 这 种 
方法 来 合成 密 钥 P 和 密 
钥 S， 就 会 得 到 由 这 两 


mrs| 个 密 钥 的 成 分 所 构成 的 
密 钥 P-S。 
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密 钥 之 间 可 以 合 
成 ， 但 不 能 分 解 。 起 
三 个 特 I 

赫 

下 。 第 一 5 即使 持 尔 

钥 P 和 合成 的 密 钥 P-S， 去 

也 无 法 把 密 钥 S 让 铀 

2 

出 来 。 换 








后 的 密 钥 还 可 以 继 
续 合成 。 























第 二 ， 不 管 是 怎样 合成 而 来 的 密 钥 ， 都 可 以 把 它 作 为 新 的 元 素 ， 继 续 与 别 的 密 钥 进行 合成 。 比 如 上 民 
Pp 的 这 个 例子 ， 使 用 密 钥 P 和 密 钥 P-S， 还 能 合成 出 新 的 密 钥 P-P-S。 
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第 三 , 密 钥 的 合成 结果 与 合成 顺序 无 关 , 只 与 用 了 哪些 密 钥 有 关 。 比 如 合成 密 钥 B 和 密 钥 C 后 , 得 到 的 是 密 
钥 B-C, 再 将 其 与 密 钥 和 合成, 得 到 的 就 是 密 钥 A-B-C。 而 合成 密 钥 入 和 密 钥 C 后 , 得 到 的 是 密 钥 A-C， 
再 将 其 与 密 钥 B 合成， 得 到 的 就 是 密 钥 B-A-C。 此 处 的 密 钥 A-B-C 和 密 钥 B-A-C 是 一 样 的 。 
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久 internet 和 


密 钥 P 就 算 泄露 
也 无 须 担心 。 


我 们 试 一 试用 这 种 方 


法 ， 在 A 和 B 这 两 人 
之 间 安 全 地 交换 密 铀 
。 首先 由 人 A 生成 密 


2 internet 入 
二 岂 一 一 一 二 全 





























然后 A 把 密 钥 P 发 送 


久 internet 和 
+- 一 一 + 一作 
| .由 


需要 对 密 钥 SA 和 
SB 进行 保密 管理 。 





接 下 来 , A 和 B 各 自 准 


次: 


自己 的 私 























和 SB。 
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密 钥 SA 





©9 : 

8 : mm 
| | | 
| * 目 "有 | 
= 全 1 





灌 阔 强 峡 曙 沧 滞 - 共计 








密 钥 P 和 私有 密 铀 SA 合成 新 的 密 钥 ”， B 也 利用 密 钥 P 和 私有 密 铀 SB 合成 新 的 密 铀 


























“四 

-J 明 
| 
合成 的 结果 与 合成 顺序 无 关 , 所 以 SA-P- 
SB 和 P-SA-SB 相同 。 


A 将 密 钥 P-SA 发送 给 B,，B 也 将 密 钥 P-SB 发 送 | 人 将 私有 密 钥 SA 和 收 到 的 密 钥 P-SB 合成 为 新 
给 A。 ， ”的 密 钥 SA-P-SB。 
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站 站 

一 上 人 

于 密 钥 无 法 被 分 解 ， 到 
所 以 X 无 法 取得 私有 密 Y 


钥 SA 和 SB。 [pg| 
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同样 地 ，B 也 将 私 
密 钥 SB 和 收 到 的 密 钥 
P-SA 合 成 为 新 的 密 钥 
P-SA-SB。 于 是 A 和 
B 都 得 到 了 密 钥 P-SA- 
SB。 这 个 密 钥 将 作为 
“加 密 密 钥 ”和 “ 



































我 们 来 验证 该 密 
钥 交 换 的 安全 性 。 
为 密 钥 P、 密 钥 P-SA 
和 密 钥 P-SB 需要 在 互 
联网 上 进行 传输 ， 
以 有 可 能 会 被 X 窃 听 。 












































但 是 ，X 无 法 用 自己 
窃听 到 的 密 钥 合成 出 
P-SA-SB， 因 此 这 种 
交换 方式 是 安全 的 。 









































_ 对 于 所 有 素数 P, 都 存在 一 
Pp p C 数量 的 生成 元 。 























接 下 来 用 公式 来 表示 这 种 密 钥 交 换 法 。 用 P、G 两 个 整数 来 表示 一 开始 生成 的 公开 密 钥 P。 其 
个 非常 大 的 素数 ， 而 G 是 素数 P 所 对 应 的 生成 元 ( 或 者 “ 原 根 ”) 中 的 一 个 。 















































接 下 来 ， A 和 B 分 别 准 


主 备 了 各 自 





























的 秘密 数字 X 和 了 Y。X 和 了 都 必须 小 于 P-2。 





> ei | 


分 器“ 内 由 


洪 凡 溃 时 舌 


| sa 





A 和 B 分 别 计算 “( G 的 
秘密 数字 次 方 ) mod 
P”。mod 运 算 就 是 取 余 



































安 运算 。"G mod P” 就 
鲁 是 计算 G 除 以 P 后 的 祭 
法 数 。 此 处 的 运算 等 同 于 
概念 意义 上 的 “合成 "。 
P, G—————P,6 
目 
xX Y 
» | 
CimodP 6G'modP 、 
X* ， A 和 B 将 自己 的 计算 结 
GmodP Cimod 己 果 发 送 给 对 方 。 
X 去 中 万 
Cimod “Xe modP 
G'modP Gmogdp 这 样 ， A 和 B 就 共 
[6G'modP) ‘modPp (GmodP) mod P 同 拥 了 相当 于 加 
_ cr | ry es 密 密 钥 的 数字 。 
=G modP =G modP 
人 A 和 B 收 到 对 方 的 计算 结果 后 ， 先 计算 这 个 值 的 秘密 数字 次 方 , 然后 再 mod P。 最 后 A 和 B 会 得 到 相同 
的 结果 。 
3 
渤 
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下 面 来 验证 这 种 密 钥 交换 法 的 安全 性 。 即 便 X 窃 听 了 整个 通信 过 程 ， 也 无 法 用 窃听 到 的 数字 计算 出 
和 B 共 有 的 数字 。 而 且 ，X 也 无 法 计算 出 保密 数字 X 和 也 因此 ， 此 处 使 用 迪 菲 - 赫 尔 曼 密 钥 交 换 是 安 
全 的 。 















































迪 菲 -区 尔 曼 密 钥 交换 由 惠 特 菲尔德 * 迪 菲 (Whitfield Diffie) 和 马丁 . 赫 尔 
(Martin Hellman〉 提 出 ， 两 人 在 2015 年 获得 了 图 灵 奖 。 

根据 素数 P、 生 成 元 G 和“G* mod P” 求 出 的 问题 就 是 “离散 对 数 问 题 "， 人 们 
至 今 还 未 找到 这 个 问题 的 解法 ， 而 迪 菲 - 赫 尔 曼 密 钥 交 换 正 是 利用 了 这 个 数学 难题 。 














| 瞻 补 充 说 明 


使 用 迪 菲 - 赫 尔 曼 密 钥 交 换 ， 通 信 双 方 仅 通过 交换 一 些 公开 信息 就 可 以 实现 密 钥 
交换 。 但 实际 上 ， 双 方 并 没有 交换 密 钥 ， 而 是 生成 了 密 钥 。 因 此 ， 该 方法 又 被 叫 作 “ 巡 
菲 - 区 尔 曼 密 钥 协议 ”。 
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消息 认证 码 





消息 认证 码 可 以 实现 “认证 ”和 “检测 算 改 ”这 两 个 功能 。 密 文 的 内 容 在 传输 过 程 中 可 能 
会 被 算 改 ， 这 会 导致 解密 后 的 内 容 发 生变 化 ， 从 而 产生 误会 。 消 息 认证 码 就 是 可 以 预防 这 种 情 
况 发 生 的 机 制 。 
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首先 ， 我 们 来 看 看 什么 情况 下 
需要 使 用 消息 认证 码 。 假 设 A 
在 B 处 购买 商品 ， 需 要 将 商品 
编号 abc 告 诉 B。 





















































交换 密 钥 可 以 使 
钥 加 密 或 迪 菲 - 赫 
钥 交 换 等 密 钥 交换 书 





























此 处 ,假设 A 使 用 共享 密 钥 加 


密 对 消息 进行 加 密 。A 通 过 安 
| 全 的 方法 将 密 钥 发 送 给 了 B。 


人 参考: 5-4 共享 密 钥 加 密 

他 参考 : 5-5 公开 密 钥 加 密 

参考 : 5-7 迪 菲 - 赫 尔 曼 
密 钥 交换 
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internet | 











人 A 使 用 双方 共有 的 密 钥 
对 消息 进行 加 密 。 











A 把 密 文 发 送 给 B，B 
收 到 后 对 密 文 进行 解 
密 ， 最 终 得 到 了 用 
商品 编号 abc。 

















@Il 硅 IANE 要 

向 B 发 送 密 

文 的 时 候 。 以 上 是 没有 出 现 问 题 时 
的 流程 ， 然 而 在 这 个 过 
程 中 可 能 会 发 生 下 面 的 
情况 。 
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假设 A 发 送 给 B 的 密 文 在 通信 过 程 中 被 X 恶 意 算 改 了 ， 而 B 收 到 密 文 后 没有 意识 到 这 个 问题 。 
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B 对 被 自 改 的 密 文 进行 解密 ， 得 到 消息 xyz。 ， ”BB 以 为 A 订购 的 是 编号 为 xyz 的 商品 , 于 是 将 错 
' ” 误 的 商品 发 送 给 了 A。 
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如 果 使 用 消息 认证 码 ， 就 能 检测 出 消息 已 被 自 A 生 成 了 一 个 用 于 制作 消息 认证 码 的 密 钥 ， 然 
改 。 为 了 让 大 家 了 解 实际 的 处 理 流 程 ， 我 们 再 各 用 安全 的 方法 将 密 钥 发 送 给 了 B。 

































































A 正 要 向 B 发 送 密 文 的 时 

















接 下 来 ， 人 A 使 用 密 文 和 密 钥 生成 一 个 值 。 此 处 生成 的 是 7f05。 这 个 由 密 钥 和 密 文生 成 的 值 就 是 消息 认 
证 码 ， 以 下 简称 为 MAC ( Message Authentication Code )。 


























LF 、 和 一 
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需要 确认 收 到 的 密 
文 是 否 被 算 改 过 。 


B 确认 收 到 的 密 文 并 
未 被 自 改 。 








和 人 A 一 样 ，B 也 需要 使 用 密 文 和 密 钥 来 生成 MAC。 经 过 对 比 ，B 可 以 确认 自己 计算 出 来 的 7f05 和 人 发 
来 的 7f05 一 致 。 

















我 们 可 以 把 MAC 想象 成 是 由 密 钥 和 密 文 组 成 的 字符 串 的 “ 哈 希 值 " 。 计 算 MAC 的 算法 
HMACT、OMAC2、CMACS 等 。 目 前 ，HMAC 的 应 用 最 为 广泛 。 
参考 : 5-3 哈 希 函数 



































Q@ ”Hash-based MAC 的 缩写 。 
@ ”One-key MAC 的 缩写 。 
国 “Cipherbased MAC 的 缩写 。 














接 下 来 ，B 只 需 使 用 密 钥 对 密 文 进 行 解密 即 可 。 
最 终 B 成 功 取得 了 人 发 送 过 来 的 商品 编号 abc。 
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假设 在 A 向 B 发 送 密 文 和 和 MAC 时，X 对 密 文 进 
行 了 自 改 。 





internet 


X 在 通信 过 程 中 对 密 文 进 行 了 自 改 是 怎样 一 种 
情况 呢 ? 让 我 们 回 到 A 正 要 向 B 发 送 密 文 的 时 候 。 
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B 使 用 该 密 文 计算 MAC, 得 到 的 值 是 b85c, 发 
现 和 收 到 的 MAC 不一致。 
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此 ，B 意 识 到 密 文 或 者 MAC， 甚 至 两 者 都 可 能 遭 到 了 自 改 。 于 是 B 废 弃 了 收 到 的 密 文 和 MAC， 向 A 
提出 再 次 发 送 的 请 求 。 
































加 密 仅 仅 是 一 个 数值 计算 和 处 理 的 过 程 ， 所 以 即使 密 文 被 自 改 了 ， 也 能 够 进行 解密 
相关 的 计算 。 











如 果 原 本 的 消息 是 很 长 的 句子 ， 那 么 它 被 自 改 后 意思 会 变 得 很 奇怪 ， 所 以 接收 者 有 
可 能 会 发 现 它 是 被 自 改 过 的 。 

但 是 ， 如 果 原 本 的 消息 就 是 商品 编号 等 无 法 被 人 们 直接 理解 的 内 容 ， 那 么 解密 后 接 
收 者 便 很 难 判断 它 是 否 被 自 改 。 由 于 密码 本 身 无 法 告诉 人 们 消息 是 否 被 纂 改 ， 所 以 就 需 
要 使 用 消息 验证 码 来 检测 。 
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>” 补充 说 明 


和 配 文 讲解 了 使 用 MAC 检测 密 文 是 否 被 自 改 的 方法 ， 接 着 我 们 来 进 
考 : XX 会 不 会 为 了 让 密 文 的 自 改 变 得 合理 ， 而 对 MAC 也 进行 自 改 呢 ? 

X 没有 计算 MAC 的 密 钥 ， 所 以 即便 他 可 以 自 改 MAC， 也 无 法 让 自 改 后 的 密 文 变 得 
合理 。 所 以 ， 只 要 B 计算 出 MAC， 发 现 密 文 对 应 的 MAC 与 自己 算出 的 不 同 ， 就 能 确认 
通信 过 程 中 发 生 了 算 改 (请 参考 下 图 )。 

























































































就 像 这 样 ， 只 要 使 用 消息 认证 码 MAC， 我 们 就 能 预防 通信 过 程 中 的 得 改行 为 。 

然而 ， 这 种 方法 也 有 缺点 。 在 使 用 消息 认证 码 的 过 程 中 ，AB 双方 都 可 以 对 消息 进 
了 加 密 并 且 算 出 MAC。 也 就 是 说 ， 我 们 无 法 证 明 原 本 的 消息 是 A 生成 的 还 是 B 生成 的 。 
寻 此 ， 假 如 A 是 坏人 ， 他 就 可 以 在 自己 发 出 消息 后 声称 “这 条 消息 是 B 捏造 的 ”， 












































































































































认 自 己 的 行为 。 如 果 B 是 坏人 ， 他 也 可 以 自己 准备 一 条 消息 ， 然 后 声称 “这 是 A 发 
给 我 的 消息 ”。 

使 用 MAC 时 ， 生 成 的 一 方 和 检测 的 一 方 持 有 同样 的 密 钥 ， 所 以 不 能 确定 MAC 由 
哪 方 生成 。 这 个 问题 可 以 用 下 一 节 将 会 讲 到 的 “数字 签名 ”来 解决 。 
他 参考 : 5-9 数字 签名 
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数字 签名 不 仅 可 以 实现 消息 认证 码 的 认证 和 检测 自 改 功能 ， 还 可 以 预防 事后 否认 问题 的 发 
生 。 由 于 在 消息 认证 码 中 使 用 的 是 共享 密 钥 加 密 ， 所 以 持 有 密 钥 的 收 信人 也 有 可 能 是 消息 的 发 


送 者 ， 这 样 是 无 法 预防 事后 否认 行为 的 。 而 数字 签名 是 只 有 发 信人 才能 生成 的 ， 
可 以 确定 谁 是 消息 的 发 送 者 了 。 


参考 : 5-8 消息 认证 码 


因此 使 用 它 就 























首先 ， 我 们 


来 看 一 看 数字 





签名 的 特 和 和 
B 发送 消息 


internet 








FE。 假设 A 要 向 


〇 


在 发 送 前 人 给 消息 加 上 数 


字 签 名 。 数 字 签名 只 能 





人 生成。 








internet 
消息 后 ， 可 以 确认 数 


由 A 生 成 的 。 





签名 签名 








只 要 发 送 的 消息 上 有 A 的 数字 签名 ， 就 能 确定 消息 的 发 送 者 就 是 A。 














abc 二 abc 
LA / 


签名 签名 





B 可 以 验证 数字 签名 的 正确 性 ， 但 无 法 生成 数 接 下 来 看 一 看 数字 签名 具体 是 怎样 生成 的 吧 。 
字 签 名 。 数字 签名 的 生成 使 用 的 是 公开 密 钥 加 密 。 
参考 : 5-5 公开 密 钥 加 密 

















其 也 履 湾 


1 aa- 
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internet 


8 6—?8 


我 们 先 来 复习 一 下 前 本 
的 知识 。 公 开 密 钥 加 
中 ， 加 密使 用 的 是 公开 
钥 鱼 ， 和 解密 使 用 的 是 私 
密 钥 上 。 任 何人 都 可 以 
































从 




















A 
安 
各 
安 
各 


开 密 钥 对 数据 进行 

















下 面 ， 我 们 就 来 看 一 看 使 


但 只 
人 才能 解密 数据 。 然 
; 数字 签名 却 是 恰恰 相 





持 有 私有 密 

















用 了 数字 签名 的 消息 交换 








首先 E 











流程 。 











A 准备 好 需 











要 发 送 的 消息 、 私 有 密 钥 
和 公开 密 钥 。 














消息 的 发 














送 者 来 准备 这 两 个 密 钥 ， 





这 一 点 与 公 





开 密 钥 加 密 














人 将 公开 密 钥 发 送 给 B。 
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abc internet abc internet abc 
[7 LA LA 





朴 氧 疾 喉 





























密 钥 加 密 消息 。 加 密 后 的 消息 就 是 人 将 消息 和 签名 都 发 送 给 了 B。 

















公开 密 钥 对 密 文 ( 签名 ) 进行 解密 。 
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[ 签名 [签名 
































B 对 解密 后 的 消息 进行 确认 ， 看 它 是 否 和 收 到 的 消息 一 致 。 流 程 到 此 结束 。 


在 步骤 07~ 步骤 122 中 ， 生 成 的 是 “只 能 由 持 有 





















































私有 密 钥 的 A 来 加 密 ， 但 只 要 有 公 








开 密 钥 ， 谁 都 可 以 进行 解密 的 密 文 "。 这 个 密 文 作为 密码 似乎 没有 任何 意义 。 但 是 换 一 个 






































9 度 来 看 就 会 发 现 ， 它 可 以 保证 这 个 密 文 的 制作 者 只 能 是 持 有 私有 密 钥 的 A。 








在 数字 签名 中 ， 是 将 “只 能 由 A 来 加 密 的 密 文 ”作为 “签名 ”来 使 用 的 。 严 格 来 
说 ， 也 有 使 用 加 密 运 算 以 外 的 计算 方法 来 生成 签名 的 情况 。 但 是 ， 用 私有 密 钥 生成 签名 、 





















































用 公开 密 钥 验证 签名 这 一 机 制 是 相同 的 ， 所 以 为 了 方便 我 们 就 以 上 文 的 方式 进行 了 说 明 。 
在 公开 密 钥 加 密 中 ， 用 公开 密 钥 加 密 的 数据 都 可 以 用 私有 密 钥 还 原 。 而 本 节 讲 解 的 




















数字 签名 利用 的 是 用 私有 密 钥 加 密 的 数据 ， 用 公开 密 钥 解密 后 就 能 还 原 这 一 性 质 。 也 就 








是 说 ， 即 使 密 钥 的 使 用 














能 够 用 A 的 公开 密 钥 解 密 的 密 文 ， 必 定 是 由 A 生成 的 。 因 此 ， 我 们 可 以 利用 这 个 结 














顺序 不 同 ， 运 行 结果 也 都 是 一 样 的 。 并 不 是 所 有 的 公开 密 钥 加 密 
都 具有 这 个 性 质 ， 不 过 RSA 加 密 算法 是 可 以 的 。 
































论 来 确认 消息 的 发 送 者 是 否 为 A， 消息 是 否 被 人 自 改 。 











由 于 B 只 有 公开 密 钥 ， 无 法 生成 A 的 签名 ， 所 以 也 预防 了 “事后 否认 ”这 一 问题 的 


发 生 。 





> 补充 说 明 


公开 密 钥 加 密 的 加 密 和 解密 都 比较 耗 时 。 为 了 节约 运算 时 间 ， 实 际 上 不 会 对 消 
接 进 行 加 密 ， 而 是 先 求 得 消息 的 哈 希 值 ， 再 对 哈 希 值 进行 加 密 ， 然 后 将 其 作为 签名 来 使 
用 ( 请 参考 下 图 ) 
他 参考 : 5-3 哈 希 函数 
























































羽 辟 妖 江 








虽然 数字 签名 可 以 实现 “认证 ”“ 检 测 自 改 "” “预防 事后 否认 ”三 个 功能 ， 但 
一 个 缺陷 。 
那 就 是 ， 虽 然 使 用 数字 签名 后 B 会 相信 消息 的 发 送 者 就 是 A， 但 实际 上 也 有 可 能 是 
人 
其 根本 原因 在 于 使 用 公开 密 钥 加 密 无 法 确定 公开 密 钥 的 制作 者 是 谁 。 收 到 的 公开 密 
钥 上 也 没有 任何 制作 者 的 信息 。 因 此 ， 公 开 密 钥 有 可 能 是 由 某 个 冒充 A 的 人 生成 的 。 
使 用 下 一 节 将 要 讲 到 的 “数字 证 书 ” 就 能 解决 这 个 问题 。 
参考 : 5-10 数字 证 书 
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“公开 密 钥 加 密 ” 和 “数字 签名 ”无 法 保证 公开 密 钥 确实 来 自信 息 的 发 送 者 。 因 此 ， 就 算 公 
开 密 钥 被 第 三 者 恶意 蔡 换 ， 接 收 方 也 不 会 注意 到 。 不 过 ， 如 果 使 用 本 方 讲解 的 数字 证 书 ， 就 能 
保证 公开 密 钥 的 正确 性 。 
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internet 





A 持 有 公开 密 钥 PA 华 和 
私有 密 钥 SA 内 ， 现 在 想 
于 密 钥 P, 发 送 给 B。 














internet 


A 首 先 需 要 向 认证 中 心 
(Certification Authority ， 
CA ) 申请 发 行 证 书 , 证明 
公开 密 钥 PA 确 实 由 上 
生成 。 
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FE 中 心里 保管 着 他 们 自己 准备 的 公开 密 ' ”人 将 公开 密 钥 PA 和 包含 邮箱 信息 的 个 人 资 
说 钥 Sc 上 。 ，， 料 发 送 给 认证 中 心 。 
internet | internet 
认证 中 心 对 收 到 的 资料 进行 确认 ， 判断 其 是 否 为 A 本  ， ”认证 中 心 将 生成 的 数字 签名 和 资料 放 进 同 
人 的 资料 。 确 认 完毕 后 ， 认 证 中 心 使 用 自己 的 私 ， ”一 个 文件 中 。 
密 钥 Sc.， 根 据 人 的 资料 生成 数字 签名 。 | 
认证 中 心 是 管理 数字 证 书 的 组 织 机 构 。 原 则 上 谁 都 可 以 成 为 认证 中 心 ， 所 以 认证 中 心 
的 数量 也 比较 多 ， 但 建议 在 经 过 政府 审查 的 大 型 企业 机 构 进行 申请 ， 这 些 机 构 更 令 
交心 . 
9 











到 灵 社 区 会 员 夏 科 (1306027770@qq.com) 专 享 尊重 版 权 








internet 





Certification 
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a@***.com 
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A 的 数字 证 书 。 








， 把 这 个 文件 发 送 给 A。 ! ”这 个 文件 就 是 人 的 数字 证 书 


























人 A 将 作为 公开 密 钥 的 数字 证 书 发 送 给 了 B。 ， ，B 收 到 数字 证 书后 ， 确 认证 书 里 的 邮件 地 
确实 是 A 的 地 址 。 接 着 ，B 获 取 了 认证 
的 公开 密 钥 。 














1 00- 
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B 对 证 书 内 的 签名 进行 验 
证 ， 判 断 它 是 否 为 认证 中 
心 给 出 的 签名 。 证 书 中 的 
签名 只 能 用 认证 中 心 的 公 
开 密 钥 Pe 进 行 验证 。 如 果 
验证 结果 没有 异常 ， 就 能 
说 明 这 份 证 书 的 确 由 认证 
中 心 发 行 。 






































菠 丙 向 湾 









































确认 了 证 书 是 由 认证 中 心 
发 行 的 ， 且 邮件 地 址 就 是 
人 的 之 后 ，B 从 证 书 中 取 
出 A 的 公开 密 钥 Pa。 这 
开 密 钥 便 从 A 传 到 



































员 





























我 们 来 看 看 公开 密 钥 的 交付 过 程 有 没有 什么 问题 。 假设 X 冒 充 人 , 准备 向 B 发 送 公开 密 钥 P 9 
Ry Da X O 
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图 灵 社 区 会 员 夏 科 (1306027770@qq.com) 尊重 版 权 
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必 这 种 情况 下 ，X 无 法 


F 书 形式 收 到 的 公开 密 





























X 只 能 用 自己 的 邮箱 地 址 
去 申请 证 书 ， 所 以 他 无 法 
获得 人 的 证 书 。 



































假设 X 为 了 假冒 A， 准 备 在 认证 9 公开 密 钥 。 然 而 X 无 法 使 用 A 的 邮箱 地 址 ， 因 此 无 法 获 
得 A 的 证 书 。 




















| bo 一 


通过 数字 证 书 ， 信 息 的 接收 者 可 以 确认 公开 密 钥 的 制作 者 。 








在 步骤 10 中 ，B 得 到 了 认证 中 心 的 公开 密 铀 ， 但 此 处 仍 有 一 个 疑问 。 


那 就 是 ，B 得 到 的 公开 密 钥 P。 真 的 来 自 认 证 中 心 吗 ? 
由 于 公开 密 钥 自 身 不 能 表示 其 制作 者 ， 所 以 有 可 能 是 冒充 认证 中 ， 
也 就 是 说 ， 这 里 同样 存在 公开 密 钥 问题 〈 请 参考 下 图 )。 





























实际 上 ， 认 证 中 心 的 公开 密 钥 Pc 是 以 数字 证 书 的 形式 交付 的 ， 会 有 更 高 级 别 的 认证 





中 心 对 这 个 认证 中 心 署 名 (请 参考 下 图 )。 











就 像 下 页 图 中 的 树 结构 一 样 ， 由 上 面 的 认证 中 心 为 下 面 的 认证 中 心 
那么 ， 我 们 来 看 看 这 个 树 结构 是 怎么 形成 的 吧 。 假 设 存在 一 个 被 祝 


必 的 XX 所 生成 的 。 





发 行 证 书 。 








会 广泛 认可 的 认 
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证 中 心 A。 





此 时 出 现 了 一 个 刚 成 立 的 公司 B， 虽 然 B 想 要 开展 认证 中 心 的 业务 ,但 它 无 








法 得 到 社会 的 认可 。 
于 是 B 向 A 申请 发 行 数字 证 书 。 当 然 A 会 对 B 能 否 开展 认证 中 心 业 务 进行 适当 的 
检测 。 只 要 A 发 行 了 证 书 ， 公 司 B 就 可 以 向 社会 表示 自己 获得 了 公司 A 的 信任 。 于 是 ， 
















































































通过 大 型 组 织 对 小 组 织 的 信赖 担保 ， 树 结构 就 建立 了 起 来 。 

















最 项 端的 认证 中 心 被 称 为 “ 根 认 证 中 心 ”(root CA)， 其 自身 的 正当 性 由 自己 证 明 。 对 


根 认 证 中 心 














自身 进行 证 明 的 证 书 为 “ 根 证 书 "。 如 果 根 认证 中 心 不 被 信任 ， 整 个 组 织 就 无 法 





运转 。 因 此 根 认证 中 心 多 为 大 型 企业 ， 或 者 与 政府 关联 且 已 经 取得 了 社会 信赖 的 组 织 。 





























上 ， 我 们 了 解 的 都 是 个 人 之 间 交 付 公 开 密 钥 的 例子 ， 其 实在 网 站 之 间 的 通 






































信 中 同样 也 要 用 到 数字 证 书 。 只 要 能 收 到 来 自 网 站 的 含有 公开 密 钥 的 证 书 ， 就 能 确认 该 





网 站 未 被 第 三 者 冒充 。 





























此 处 的 证 书 叫 作 “服务 器 证 书 ”， 同 样 由 认证 中 心 发 行 。 个 人 的 证 书 会 与 他 的 邮箱 

















信息 相对 应 ， 而 服务 器 证 书 与 域名 信息 相对 应 。 因 此 ， 我 们 还 可 以 确认 网 站 域名 和 存储 
网 站 本 身 内 容 的 服务 器 是 由 同一 个 组 织 来 管理 的 。 


数字 订 








FE 书 就 是 像 这 样 通过 认证 中 心 来 担保 公开 密 钥 的 制作 者 。 这 一 系列 技术 规范 被 


统称 为 “ 公 钥 基础 设施 ”( Public Key Infrastructure，PKI )。 
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什么 是 聚 类 


1 将 相似 的 对 象 分 为 一 组 


聚 类 就 是 在 输入 为 多 个 数据 时 ， 将 “相似 ”的 数据 分 为 一 组 的 操作 。1 个 组 就 叫 作 1 个 
“ 徐 ”"。 下 面 的 示例 中 每 个 点 都 代表 1 个 数据 ， 在 平面 上 位 置 较为 相近 、 被 圈 起 来 的 点 就 代表 一 
类 相似 的 数据 。 也 就 是 说 ， 这 些 数 据 被 分 为 了 3 个 艇 。 














1 如 何 定义 “相似 ” 


> 定义 数据 间 的 差距 

根据 数据 类 型 不 同 ， 定义 该 数据 是 否 “ 相 似 ” 的 标准 也 不 同 。 具 体 来 说 ， 就 是 要 对 两 个 数 
据 之 间 的 “差距 ”进行 定义 。 首 先 来 看 下 面 的 示例 。 

假设 某所 高 中 的 某 个 年 级 中 共有 400 名 学 生 ， 现 在 我 们 想 要 将 这 些 学 生 在 考试 中 取得 的 语 
文 、 数 学 、 英 语 成 绩 数据 化 ， 并 将 他 们 按照 “擅长 或 不 擅长 的 科目 相似 ”进行 聚 类 。 




















把 每 个 学 生 都 转换 成 “( 语文 成 绩 , 数学 成 绩 , 英语 成 绩 》 形式 的 数据 后 ， 就 可 以 将 两 个 数 
据 (com e) 和 (cmse) 之 间 的 差距 定义 为 (ci-cj) + (mi-m) +(e-e) ， 其 中 差距 小 的 数据 
就 互 为 “相似 的 数据 ”。 








> 符合 条 件 的 算法 

即使 定义 好 了 数据 间 的 差距 ， 聚 类 的 方法 也 会 有 很 多 种 。 我 们 可 以 设 定 各 种 各 样 的 条 件 ， 
比如 想 把 数据 分 为 10 个 复 ， 或 者 想 把 1 个 簇 内 的 数据 定 在 30~50 人 之 间 ， 再 或 者 想 把 簇 内 数据 
间 的 最 大 距离 设 为 10， 等 等 。 而 设 定 什么 样 的 条 件 取决 于 进行 聚 类 的 目的 。 

假如 是 为 了 开办 暑期 补习 班 而 对 学 生 进 行 分 班 ， 那 么 就 要 根据 老师 和 教室 的 数量 来 确定 
“ 簇 的 数量 "， 并 根据 教室 的 面积 确定 “每 个 簇 内 的 数据 量 "。 现 在 有 很 多 种 可 以 满足 各 类 条 件 的 
聚 类 算法 供 我 们 选择 。 

下 一 节 就 将 介绍 其 中 最 基本 ， 也 是 最 有 代表 性 的 聚 类 算法 “上 means 算法 ”。 该 算法 可 以 把 
数据 按 要 求 分 为 上 个 篮 。 



































头 潮 各 从 字 
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G 2 k-means 算法 

























































































聚 Pe » i 的 米 b 导 .， 秆 4 二 > 
类 k-means 算法 是 聚 类 算法 中 的 一 种 ， 它 可 以 根据 事先 给 定 的 簇 的 数量 进行 聚 类 。 
准备 好 需要 聚 类 的 数据 ， 然 后 决定 簇 的 数量 。 
中 我 们 将 簇 的 数量 定 为 3。 此 处 用 点 表示 数 
两 点 间 的 直线 距离 表示 数据 间 的 差距 。 
© 
@ 
， 
» 
® 
| 此 处 用 不 同 颜 
| 色 的 线 连接 各 
个 数据 和 距离 
该 数据 最 近 的 计算 各 个 数据 分 别 和 3 
Ea 个 中 心 点 中 的 哪 一 个 点 
距离 最 近 。 
1 
6 
8 
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将 数据 分 到 相应 的 簇 








Pp 心 点 的 移动 ， 部 分 
数据 的 “距离 自己 最 近 的 
中 心 点 ”也 会 改变 。 





计算 各 个 簇 中 数据 的 重 放 














重新 计算 距离 最 近 的 簇 的 中 心 点 ， 并 将 数据 分 到 相应 的 簇 

















记 一 O 


详 业 Sueeu-y 


1 oo0- 








状 测 


E 复 执行 “将 数据 分 到 相应 的 入 中 ”和 “将 中 心 
点 移 到 重心 的 位 置 ” 这 两 个 操作 , 直到 中 心 点 不 
发 生变 化 为 止 。 












































此 时 我 们 可 以 确定 , 相 
似 的 数据 已 经 被 恰当 
Bt 2 o 














4 轮 操 作 结 束 后 ， 结 果 如 上 图 所 示 。 即 使 继续 台 
类 也 就 完成 了 。 
































E 复 操作 ， 中 心 点 也 不 会 再 发 生变 化 ， 操 作 到 此 结束 ， 聚 





1 o~- 





k-means 算法 中 ， 随 着 操作 的 不 断 重 复 ， 中 心 点 的 位 置 必定 会 在 某 处 收 售 ， 这 一 点 
已 经 在 数学 层面 上 得 到 证 明 。 
的 例子 中 我 们 将 簇 的 数量 定 为 3， 若 现在 使 用 同样 的 数据 ， 将 簇 的 数量 定 为 2， 
那么 聚 类 将 如 下 图 所 示 。 



































详 往 Sueeu-y 





位 于 左边 和 下 边 的 两 个 数据 块 被 分 到 了 一 个 得 中 。 就 像 这 样 ， 由 于 上 means 算法 需 


/ 公 加 












































要 事先 确定 好 簇 的 数量 ， 所 以 设 定 的 数量 如 果 不 合 理 ， 运 行 的 结果 就 可 能 会 不 符合 我 们 
的 需求 。 








如 果 对 繁 的 数量 没有 明确 要 求 ， 那 么 我 们 可 以 事先 对 数据 进行 分 析 ， 推 算出 一 个 合 
适 的 数量 ， 或 者 不 断 改变 复 的 数量 来 试验 k-means 算法 。 

另外 ， 如 果 往 的 数量 同样 为 2， 但 中 心 点 最 初 的 位 置 不 同 ， 那 么 也 可 能 会 出 现下 医 
这 样 的 聚 类 结果 。 









































| dl iad 


与 之 前 的 情况 不 同 ， 这 次 右上 和 右 下 的 两 个 数据 块 被 分 到 了 一 个 徐 中 。 也 就 是 说 ， 
即使 纂 的 数量 相同 ， 只 要 随机 设置 的 中 心 点 最 初 的 位 置 不 同 ， 聚 类 的 结果 也 会 产生 变化 。 
因此 ， 我 们 可 以 通过 改变 随机 设 定 的 中 心 点 位 置 来 不 断 尝试 k-means 算法 ， 再 从 中 选择 
最 合适 的 聚 类 结果 。 
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> 补充 说 明 















































除了 k-means 算法 以 外 ， 聚 类 算法 还 有 很 多 ， 其 中 “层次 聚 类 算 ; 
k-means 算法 不 同 ， 层 次 聚 类 算法 不 需要 事先 设 定 复 的 数量 。 

在 层次 聚 类 算法 中 ， 一 开始 每 个 数据 都 自 成 一 类 。 也 就 是 说 ， 有 n 个 数据 就 会 形成 
n 个 徐 。 然 后 重复 执行 “将 距离 最 近 的 两 个 徐 合 并 为 一 个 ”的 操作 -1 次 。 每 执行 1 次 ， 
簇 就 会 减少 1 个。 执行 -1 次 后 ， 所 有 数据 就 都 被 分 到 了 一 个 簇 中 。 在 这 个 过 程 中 ， 每 
个 阶段 的 复 的 数量 都 不 同 ， 对 应 的 聚 类 结果 也 不 同 。 只 要 选择 其 中 最 为 合理 的 1 个 结果 





































































































就 好 。 
合并 签 的 时 候 ， 为 了 找 出 “距离 最 近 的 两 个 徐 ”， 需 要 先 对 簇 之 间 的 距离 进行 定义 。 
根据 定义 方法 不 同 ， 会 有 “最 短 距离 法 ”“ 最 长 距离 法 ”“ 中 间距 离 法 ”等 多 种 算法 。 
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其 他 算法 





7 了 -1 | 欧 几 里 得 算法 





欧 几 里 得 算法 〈 又 称 辊 转 相 除法 ) 用 于 计算 两 个 数 的 最 大 公约 数 ， 被 称 为 世界 上 最 古老 的 
算法 。 现 在 人 们 已 无 法 确定 该 算法 具体 的 提出 时 间 ， 但 其 最 早 被 发 现 记 载 于 公元 前 300 年 欧 几 
里 得 的 著作 中 ， 因 此 得 以 命名 。 


三 
他 
算 
法 


1112 095 











有 得 算法 之 前 ， 我 们 先 来 看 一 看 数字 1112 和 695 的 最 大 公约 数 是 多 少 吧 。 








139 x2x2x2 
139 x5 
139 … GCD 





通常 的 做 法 是 先 对 两 个 数字 因 式 分 解 ， 找 出 共同 的 素数 ， 然 后 求 出 最 大 公约 数 ( GCD )。 这 样 就 能 求 出 
1112 和 695 的 最 大 公约 数 为 139。 然 而 两 个 数字 越 大 ， 因 式 分 解 就 越 难 。 此 时 ， 使 用 欧 几 里 得 算法 就 
能 更 高 效 地 求解 最 大 公约 数 。 





























| sa~- 


ER 


1112 695 


那么 ， 我 们 就 来 看 一 看 欧 几 里 得 算法 的 具 
作 流 程 吧 。 

















1112 mod 695 = 417 





继续 重复 同样 的 操作 ， 对 417 和 278 进 行 mod 
运算 ， 结 果 为 139。 





1112 mod 695 = 














首先 用 较 小 的 数字 去 除 较 大 的 数字 ， 求 出 余 
数 。 也 就 是 对 两 个 数字 进行 mod 运算。 我 们 在 
第 5 章 也 讲 过 mod 运 算 即 取 余 运算 ,， 4 mod B 
就 是 算出 4 除 以 后 的 余数 C。 





























278 














接 下 来 再 用 除数 695 和 余数 417 进 行 mod 运 
算 。 结 果 为 278。 


对 278 和 139 进 行 mod 和 运算， 结果 为 0。 也 就 
是 说 ，278 可 以 被 139 整 除 。 





诗 熔 葵 昌 己 愉 


| oo~- 





分 别 用 相应 长 度 的 直线 来 
表示 1112 和 695。 






























































其 
他 
汪 417 mod 278 
278 mod 139 ' 
132 ~ GCD 1112 695 
余数 为 0 时 ， 最 后 一 次 运算 中 的 除数 139 就 是 ， eri ee Rs 得 
1112 和 695 的 最 大 公约 数 。 呢 ? 我 们 结合 医 
实际 上 我 们 并 不 知道 两 条 直 
线 可 以 被 划分 为 多 少 个 刻度 
但 是 可 以 确定 1112 和 695 一 
n{ 定 是 最 大 公约 数 /的 整数 倍 。 
1112 695 
将 最 大 公约 数 设 为 n， 然后 在 直线 上 画 出 相应 刻度 。 由 于 我 们 已 知 最 大 公约 数 为 139， 所 以 为 了 方便 理 
解 ， 在 1112 上 画 出 8 个 刻度 ， 在 695 上 画 出 5 个 刻度 。 
从 这 张 图 就 能 看 出 ,417 正 
好 也 可 以 用 长 度 为 n 的 刻 
度 划 分 。 
417 695 
u 这 里 和 前 面 的 运算 一 样 ， 用 小 的 数 去 除 大 的 数 ， 得 到 的 余数 为 417。 
6 
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1 
余数 278 同样 也 是 n 的 
整数 倍 。 
欧 
几 
里 
得 
算 
法 
nt{ 
417 
继续 做 除法 。 由 于 278 可 以 被 139 整 除 , 所 ' 余数 为 0。 此 时 便 能 求 得 最 大 公约 数 n 为 139。 
使 用 欧 几 里 得 算法 ， 只 需 重 复 做 除法 便 能 求 得 最 大 公约 数 。 这 个 算法 最 大 的 优势 就 
在 于 即使 两 个 数字 再 大 ， 只 要 按照 步骤 进行 操作 就 能 高 效 地 求 得 两 者 的 最 大 公约 数 。 
1 
了 
7 
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素性 测试 





素性 测试 是 判断 一 个 自然 数 是 否 为 素数 的 测试 。 素 数 (prime number ) 就 是 只 能 被 1 和 其 自 
身 整 除 ， 且 大 于 1 的 自然 数 。 素 数 从 小 到 大 有 2、3、5、7、11、13…… 目 前 在 加 密 技术 中 被 广 
泛 应 用 的 RSA 算法 就 会 用 到 大 素数 ， 因 此 “素性 测试 ”在 该 算法 中 起 到 了 重要 的 作用 。 
参考 : 5-5 公开 密 钥 加 密 


3599 


我 们 来 试 着 判断 3599 是 否 为 素数 吧 。 简 单 的 方法 便 是 将 3599 按 顺序 除 以 比 2 大 的 数字 ， 看 是 否 能 被 
整除 “整除 ”就 是 指 mod 运算 的 结果 为 0。 由 于 3599 的 平方 根 为 59.99…, 所 以 只 需要 除 以 从 2 到 59 

















3599 关 素数 
3599 mod2 =1 
3599 mod 3 =2 


3599 mod 58 =3 9 
3599 mod 59 =0 @ 


根据 mod 运算 的 结果 可 知 ，3599 能 被 59 整 除 。 也 就 是 说 ，3599 并 不 是 素数 。 人 
常 大 ， 这 种 方法 就 十 分 耗费 时 间 。 这 种 时 候 就 可 以 用 “ 费 马 测试 ”来 解决 这 个 问 











1 


D 素 

















费 马 测试 被 称 为 概率 性 素性 测试 ， 它 判断 的 是 “ 某 个 数 是 素数 的 概率 大 不 大 ”。 在 讲解 费 马 测试 之 前 ， 副 
我 们 先 来 学 习 基 础 知识 一 一 素数 的 性 质 。 首 先 来 看 一 看 素数 5 有 什么 样 的 性 质 。 
4 (=1024 mod5=4 
3 (=243] mod5=3 
2 (=32)] mod5=2 
1 (=1) mod5=1 
对 于 比 5 小 的 数 , 分 别 计算 它们 的 5 次 方 , 结果 接 下 来 ， 再 对 结果 分 别 进行 mod 运算 ， 求 得 它 
如 上 图 所 示 。 们 除 以 5 后 的 余数 ， 结 果 如 上 图 所 示 。 
mod5=4 
mod5=3 
mod5=2 
mod5=1 
观察 原本 的 数 和 余数 ， 发 现 两 者 一 致 。 | 由 此 ， 可 以 推导 出 关于 素数 5， 以 上 公式 成 立 。 4 
. 9 
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en 113 


其 
他 p 
和 nmod p=n 


实际 上 不 只 是 5， 对 于 任意 素数 p， 上 面 的 公式 。 ; 那么， 我们 就 用 费 马 测试 来 判断 一 下 113 是 否 
都 是 成 立 的 。 这 就 是 “ 费 马 小 定理 "。 根 据 是 否 。 ， ”为 素数 吧 。 

满足 费 马 小 定理 来 判断 一 个 数 是 否 为 素数 的 方 

法 就 是 “ 费 马 测试 "。 

















113 = 素数 (?) 


113 


64 mod 113 = 04 @ 


113 


29 mod113 =29 © 


113 


15 mod 113=15 © 


随机 选择 3 个 比 113 小 的 数 作为 ， 计 算 这 些 数 的 113 次 方 ， 再 用 113 去 除 得 到 的 结果 ， 求 出 余数 。3 
个 数 最 后 得 到 的 余数 都 和 原本 的 数 相同 ， 因 此 可 以 判断 113 是 素数 。 


确认 n 和 余数 一 致 的 次 数 越 多 ， 需 要 判断 的 数 确实 为 素数 的 可 能 性 就 越 大 。 但 是 ， 
如 果 每 一 个 小 于 p 的 数 都 要 去 计算 ， 就 会 非常 耗费 时 间 。 实 际 上 ， 如 果 确 认 了 几 组 n 和 
余数 之 后 就 能 判断 该 数 是 素数 的 可 能 性 非常 高 ， 那 么 大 致 就 可 以 判定 该 数 是 素数 了 。 

比如 在 RSA 算法 中 ， 用 于 素性 测试 的 是 根据 费 马 测试 改进 而 来 的 “ 米 勒 - 拉 宾 
CMiller-Rabin) 素性 测试 ”。 用 这 个 方法 重复 进行 测试 后 ， 当 数 不 是 素数 的 概率 小 于 0.58 
时 ， 就 可 以 大 致 判断 该 数 为 素数 。 


















































1 ec o 一 


\ 补充 说 明 

如 果 p 是 素数 ， 那 么 所 有 比 p 小 的 数 n 都 满足 nrmod p = n 这 个 条 件 。 但 反 过 来 ， 
即使 所 有 n 都 满足 条 件 ，p 也 有 可 能 不 是 素数 。 因 为 在 极 低 概 率 下 会 出 现 所 有 nn 都 满足 
条 件 的 合 数 〈 非 素数 的 自然 数 )。 

比如 数字 561 可 以 表示 为 3x11x17， 所 以 561 是 合 数 ， 不 是 素数 。 然 而 比 561 小 
的 所 有 数字 都 满足 上 述 条 件 。 

这 样 的 合 数 就 叫 作 “ 卡 迈 克 尔 数 ”( Carmichael numbers )， 也 叫 “ 绝 对 伪 素 数 "。 下 
图 按 从 小 到 大 的 顺序 列举 了 一 些 卡 迈克 尔 数 ， 可 以 看 出 这 种 数字 非常 少 。 








561 1105 1729 
2465 2821 6601 
8911 10585 15841 
29341 41041 46657 


52633 62745 ”63973 











在 过 去 很 长 一 段 时 间 内 ， 人 们 都 无 法 确定 是 否 可 以 应 用 一 个 算法 在 输入 规模 的 多 项 式 时 
间 内 进行 ( 非 概率 意义 ， 而 是 决定 性 的 ) 素性 测试 。 然 而 在 2002 年 ， 印 度 的 三 位 数学 家 
证 明了 它 的 可 行 性 。 他 们 提出 的 就 是 “AKS 算法", 该 名 称 也 是 以 他 们 名 字 的 首 字 母 来 命 
名 的 。 不 过 ， 虽说 是 “在 多 项 式 时 间 内 ”， 但 该 算法 的 计算 次 数 仍 然 较 多 ， 所 以 费 马 测试 
这 样 的 高 速算 法 更 为 实用 ， 应 用 范围 也 更 加 广泛 。 




































































7- 二 | 网 页 排名 





网 页 排名 《PageRank， 也 叫 作 佩 奇 排名 ) 是 一 种 在 搜索 网 页 时 对 搜索 结果 进行 排序 的 算法 。 
Google 因 在 搜索 引擎 中 使 用 了 这 个 算法 而 成 为 了 世界 知名 的 大 企业 是 众所周知 的 事情 。 


GTNES 


1. ， ofA goritnms 
ES - 在 搜索 结果 中 越 是 排 在 前 面 
-0 的 网 页 ， 其 价值 也 就 越 高 。 











2. sorting algorithm 





3. Algorithm i 


























网 页 排名 就 是 利用 网 页 之 间 的 链接 结构 计算 出 网 页 价值 的 算法 。 我 们 来 看 看 具体 的 计算 流程 吧 。 














在 这 张 图 中 ， 下 面 的 3 个 网 页 都 链 向 Ne 
ee 这 里 假设 方块 表示 网 页 ， 


箭头 表示 网 页 间 的 链接 
关系 。 在 网 页 排名 中 , 链 
入 页 面 越 多 的 网 页 ， 它 
的 重要 性 也 就 越 高 。 
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从 这 张 图 中 我 们 可 以 看 出 ， 上 面 网 页 的 重要 性 最  ， ”假设 没有 链 入 页 面 的 网 页 权重 
高 。 实 际 上 ， 各 个 网 页 的 重要 性 会 通过 计算 来 数 
值 化 。 下 面 我 们 就 来 了 解 计算 方法 的 基本 思路 。 

















如 果 一 个 网 页 链 向 多 个 页 面 ， 那 么 其 链 向 的 所 
有 页 面 将 平分 它 的 权 呈 








在 这 张 图 中 , 中 间 的 网 
页 被 3 个 独立 的 页 面 链 


页 ， 
入 ， 所 以 权重 为 3。 在 网 页 排名 中 ， 链 入 的 


页 面 越 多 ， 该 网 页 所 发 
出 的 链接 的 价值 就 越 高 。 
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WE 这 张 图 中 的 6 个 网 页 


路 祭 





最 项 端的 网 页 被 权 





为 3 的 页 面 链 接 ， 所 以 权 蝇 











但 是 ， 如 果 在 链接 结构 为 环 状 的 情况 下 使 用 这 
种 方法 ， 就 会 出 现 问 题 。 











此 时 可 以 使 用 “随机 游 走 模型 ”( random walk 
model ) 来 解决 这 个 问题 。 要 想 了 解 这 个 模型 ， 
先 得 思考 一 下 人 们 是 怎样 浏览 网 页 的 。 




















中 , 最 项 端的 网 页 重要 
性 最 高 。 


计算 各 个 网 页 权重 的 操作 会 无 限 循环 下 去 ， 从 
而 导致 环 内 网 页 的 权重 不 断 增长 。 








假设 有 一 天 ， 某 位 互联 网 用 户 想 浏览 从 杂志 上 
看 到 的 一 个 有 趣 的 网 页 。 他 从 左下 角 的 网 页 开 
台 浏览 ， 然 后 通过 链接 到 达 其 他 网 页 。 
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了 一 些 网 页 后 他 不 想 再 看 了 ， 于 是 结束 





这 次 也 通过 链接 浏览 了 别 的 网 页 ， 并 在 一 段 时 
间 后 结束 了 浏览 。 就 像 这 样 ， 他 重复 着 从 某 个 
网 页 开始 ， 通 过 链接 浏览 了 几 个 网 页 后 结束 的 


流程 。 





过 了 几 天 ， 他 又 开始 浏览 朋友 推荐 的 一 个 与 之 
前 完全 不 同 的 网 页 。 


如 果 我 们 站 在 互联 网 空间 的 视角 来 观察 上 述 流 
程 ， 就 会 觉得 浏览 网 页 的 人 只 是 在 不 断 重复 着 
“在 有 链接 指向 的 页 面 之 间 移 动 几 次 之 后 ， 远 
程 跳 转 到 了 完全 不 相关 的 网 页 ”这 一 过 程 。 
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那么 ， 用 户 浏览 网 页 的 操作 就 可 以 这 样 来 定 ”' ”此 处 我 们 将 远程 跳 转 概 率 a 设 为 15%， 并 根据 
义 : 用 户 等 概率 跳 转 到 当前 网 页 所 链 向 的 一 个 ”， ”前 面 的 定义 来 模拟 一 下 网 页 间 的 跳 转 过 程 。 

网 页 的 概率 为 1-a ; 等 概率 远程 跳 转 到 其 他 网 

页 中 的 一 个 网 页 的 概率 为 a。 





和 前 面 一 样 ， 要 思 














网 页 上 的 数字 代表 用 户 访问 该 网 页 的 次 数 。 现 ”， ”开始 根据 定义 模拟 用 户 浏览 网 页 的 过 程 ， 各 个 
在 模拟 还 未 开始 ， 所 有 的 数字 都 是 0。 ， ”网 页 的 访问 次 数 也 开始 出 现 差距 。 


在 Google 创 业 初 期 还 没有 广告 收入 的 时 候 ， 作 家 兼 编辑 凯 文 :凯利 向 Google 创 始 人 之 一 
的 拉 里 : 佩 奇 提 过 一 个 问题 :“ 你 们 为 什么 要 做 免费 的 网 络 搜索 服务 ? ”而 对 方 的 回答 是 














“我 们 实际 上 是 在 做 AI ( 人 工 智 能 )。 








上 自 《 必 然 》( 凯 文 ， 凯 利 著 ， 周 峰 、 董 理 、 金 阳 译 ， 电 子 工业 出 版 社 ，2016 年 )。 
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模拟 该 过 程 直到 访问 的 总 次 数 达到 1000 次 为 
止 ， 最 终结 果 如 上 图 所 示 。 








使 用 这 个 方法 ， 就 算 
网 页 链接 结构 为 环 
状 ， 我 们 也 可 以 得 出 
每 个 网 页 的 权重 。 











换算 成 百分比 后 ,结果 如 上 图 所 示 。 这 些 值 代表 的 是 “ 某 一 刻 正在 浏览 这 个 网 页 的 概率 "， 随 机 游 走 模 
型 会 直接 将 其 作为 网 页 的 权重 来 使 用 。? 











使 用 上 述 方法 计算 该 链接 构 
造 中 的 网 页 权重 。 


最 后 ， 我 们 来 确认 网 页 排名 的 值 和 最 初 介绍 的 用 链接 加 权 计 算 的 结果 是 否 一 致 。 














QD 实际 上 一 般 不 会 用 模拟 ， 而 是 用 更 高 效 的 方法 来 计算 。 但 无 论 用 哪 种 方法 ， 计 算 结果 几乎 都 是 相同 的 。 
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由 于 各 个 值 都 是 四 使 五 入 后 的 结果 ， 所 以 所 有 ”， ”这 是 前 面 讲 到 的 链接 结构 ， 试 着 计算 它 的 权重 。 
值 加 起 来 并 不 等 于 1， 但 分 值 比例 与 之 前 的 结 
果 是 非常 接近 的 。 














网 页 排名 的 机 制 就 是 像 这 样 ， 
把 之 前 的 权重 替换 为 访问 页 
面 的 概率 来 进行 计算 。 


可 以 看 出 ， 此 处 的 分 值 比例 也 和 之 前 的 很 相近 。 
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以 前 的 搜索 引擎 都 是 以 关键 词 和 网 页 内 容 的 关联 性 来 决定 搜索 结果 的 排列 顺序 ， 但 
这 种 方法 没有 考虑 网 页 内 是 否 含有 有 效 内 容 ， 因 此 搜索 精度 较 低 。 

Google 公司 提供 了 使 用 网 页 排名 算法 的 搜索 引擎 ， 然 后 凭借 其 强大 的 性 能 成 为 了 世界 
知名 企业 。 当 然 ， 如 今 决定 Google 搜索 结果 排序 的 已 不 仅仅 是 网 页 排名 这 一 个 算法 了 。 

但 不 管 是 从 利用 网 页 链接 结构 计算 出 网 页 价值 这 种 思路 来 看 ， 还 是 从 链接 形成 环 状 
时 也 能 进行 计算 这 点 来 看 ， 网 页 排名 都 是 一 个 划时代 的 算法 。 
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7-4 | 汉 诺 典 





汉 诺 塔 是 一 种 移动 圆 盘 的 游戏 ， 同 时 也 是 一 个 简单 易 懂 的 递归 算法 应 用 示例 。 
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1 游戏 规则 


GOAL 


总 - 生 


游戏 开始 时 如 左 图 所 示 ， 有 3 根 柱子 A、B 、C,， 柱子 A 上 有 5 个 圆 盘 。 把 这 5 个 圆 盘 按照 
原本 的 顺序 移动 到 柱子 C 上 之 后 游戏 就 会 结束 。 
移动 圆 盘 时 需要 遵守 以 下 两 个 条 件 。 


> 移动 条 件 
QD 1 次 只 能 移动 1 个 圆 盘 。 
@) 不 能 把 大 的 圆 盘 放 在 小 的 圆 盘 上 。 








我 们 的 目标 就 是 在 这 两 个 条 件 下 ， 通 过 把 圆 盘 往 B 或 C 移动 来 完成 游戏 。 
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本 四 


本 
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先 来 看 看 只 有 2 个 圆 盘 的 情况 吧 。 ， 9 圆 盘 在 最 项 端 , 所 以 可 以 把 它 移动 到 B 上 。 








中 


= 


A B 
再 把 小 圆 盘 往 C 和 移动， 操作 完毕 。 由 
个 圆 盘 ， 此 时 便 可 以 确认 游戏 结束 。 




















3 个 圆 盘 时 又 会 怎样 呢 ? 我 们 可 以 忽略 最 大 的 ， ， 将 其 他 的 2 个 圆 盘 按照 之 前 移动 只 有 2 个 园 
圆 盘 ， 先 将 其 他 的 圆 盘 往日 移动 。 ， 。 时 的 操作 移动 到 B。 



































所 
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A B A B C 
然后 把 最 大 的 圆 盘 移动 到 C。 再 次 按照 之 前 的 操作 ， 把 B 上 的 2 个 圆 盘 移动 到 
， Ce。 于 是 ,3 个 圆 盘 的 移动 也 完成 了 。 实 际 上 ,不 
管 需要 移动 多 少 圆 盘 ， 这 个 游戏 最 终 都 能 达成 上 
标 。 我 们 试 着 用 数学 归纳 法 来 证 明 这 个 结论 吧 。 
C 
只 有 1 个 未 假设 圆 盘 数量 为 4 时 同样 可 以 达成 目标 。 
3 圆 盘 数 为 +1 的 情况 。 ， ”忽略 最 大 的 一 个 圆 盘 。 
2 
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C 


根据 之 前 的 假设 ， 圆 盘 数 量 为 2 时 可 以 达成 
标 ， 所 以 先 把 n 个 圆 盘 移动 到 B。 



























































使 用 数学 归纳 法 , 证 明了 不 管 
圆 盘 数量 为 多 少 , 最 终 都 可 以 
达成 目标 。 





bh 
a 
a 
a 
a 
a 
a 
a 
a 
a 
a 
a 
a 
a 





A B C 
最 后 再 把 B 上 的 7 个 圆 盘 移 动 到 C， 游 戏 结束 。 


大 家 可 能 会 觉得 这 太 简 单 了 ， 但 是 要 想 移动 岂 个 圆 盘 ， 只 需要 按照 移动 4-1 个 圆 盘 
时 的 方法 移动 即 可 。 而 要 移动 2-1 个 圆 盘 ， 就 需要 按照 移动 2-2 个 圆 盘 时 的 方法 移动 。 
这 样 追溯 下 去 ， 最 终 就 会 回 到 移动 1 个 圆 盘 时 的 操作 方法 上 。 

像 这 样 ， 在 算法 描述 中 调用 算法 自身 的 方法 就 叫 作 “ 递 归 ”。 递 归 被 运用 到 各 种 各 
样 的 算法 中 ， 这 些 算法 统称 为 “递归 算法 ”。2-6 节 中 讲 到 的 归并 排序 和 2-7 节 中 讲 到 的 
快速 排序 便 是 递归 算法 的 示例 。 

CO 参考: 2-6 归并 排序 
CG 参考: 2-7 快速 排序 
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> 补充 说 明 




















我 们 再 来 看 一 看 递归 算法 需要 的 运行 时 间 。 

假设 解决 有 n 个 圆 盘 的 汉 诺 塔 问 题 时 需要 的 时 间 为 7(n)。 只 有 1 个 圆 盘 时 只 需 1 步 
就 能 完成 ， 所 以 7(1)=1。 圆 盘 数 为 n 时 ， 把 上 面 的 n-1 个 圆 盘 从 和 A 移 到 B 上 需要 7 -1)， 
再 把 最 大 的 圆 盘 移 到 C 上 需要 1 步 ， 最 后 把 B 上 的 n-1 个 圆 盘 移 到 C 上 需要 7T(n-1)， 
因此 T(n)=27(n-1)+1o 

上 面 的 公式 即 为 Tln)=2"-1， 这 便 是 解决 这 个 问题 所 需要 的 最 短 时 间 。 
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